вытащить капчу гугла

Discussion in 'PHP' started by rainboww, 14 Mar 2010.

  1. rainboww

    rainboww New Member

    Joined:
    23 Oct 2009
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    Помогите спарсить капчу гугла.

    У меня вот такой код, странно должен работать но что-то не работает
    PHP:
    <?php
    $ch 
    curl_init();  
        
    curl_setopt($chCURLOPT_URL,"https://www.google.com/accounts/NewAccount?service=blogger&continue=https%3A%2F%2Fwww.blogger.com%2Floginz%3Fd%3D%252Fcreate-blog.g%26a%3DADD_SERVICE_FLAG&hl=ru&sendvemail=true&followup=https%3A%2F%2Fwww.blogger.com%2Floginz%3Fd%3D%252Fhome%26a%3DSERVICE_ONLY&naui=8"); 
        
    curl_setopt($chCURLOPT_RETURNTRANSFER1);  
        
    curl_setopt($chCURLOPT_FOLLOWLOCATION1);  
        
    curl_setopt($chCURLOPT_COOKIEJAR'cookie.txt'); 
        
    $result curl_exec($ch);
           
    preg_match('#<input type="hidden" id="newaccounttoken" name="newaccounttoken" value="([a-f0-9]+)">#i'$result$key);
                  
           
    print_r($key[1]);
           
    $result curl_exec($ch);  
           
    curl_close ($ch); 

    ?>
     
  2. IgrikX

    IgrikX New Member

    Joined:
    13 Aug 2009
    Messages:
    114
    Likes Received:
    1
    Reputations:
    -3
    Ну, так ты попробуй пройти на страницу.. пишет не существует..
     
  3. rainboww

    rainboww New Member

    Joined:
    23 Oct 2009
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    заменил на https://www.google.com/accounts/NewAccount?service=blogger

    Все равно не пахало. Там дело в регулярке было.. не та регулярка

    Вот если кому надо, рабочая:

    PHP:
    preg_match('#<input type="hidden" id="newaccounttoken" name="newaccounttoken" value="(.*?)">#i'$result$key);
     
  4. IgrikX

    IgrikX New Member

    Joined:
    13 Aug 2009
    Messages:
    114
    Likes Received:
    1
    Reputations:
    -3
    там ssl
     
    #4 IgrikX, 14 Mar 2010
    Last edited: 14 Mar 2010
  5. IgrikX

    IgrikX New Member

    Joined:
    13 Aug 2009
    Messages:
    114
    Likes Received:
    1
    Reputations:
    -3
    Вот так вот страница загружается и теперь ты можешь парсить данные..
    PHP:
    <?php 
    $url
    ="https://www.google.com/accounts/NewAccount?continue=http%3A%2F%2Fwww.google.ru%2F&hl=ru"
      
    $curl curl_init();     
      
    curl_setopt($curlCURLOPT_URL$url); 
      
    curl_setopt($curlCURLOPT_USERAGENT'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)'); 
      
    curl_setopt($curlCURLOPT_COOKIEFILE'C:/cookies.txt');
      
    curl_setopt($curlCURLOPT_HEADER,1); 
      
    curl_setopt($curlCURLOPT_ENCODING'gzip,deflate'); 
      
    curl_setopt($curlCURLOPT_AUTOREFERERtrue);     
      
    curl_setopt($curlCURLOPT_RETURNTRANSFER1); 
      
    curl_setopt($curlCURLOPT_TIMEOUT20); 
      
    curl_setopt ($curlCURLOPT_SSL_VERIFYPEER0);
      
    curl_setopt ($curlCURLOPT_SSL_VERIFYHOST0);
      
    $html curl_exec($curl); // execute the curl command 
      
    curl_close($curl); // close the connection 
    ?>
     
  6. rainboww

    rainboww New Member

    Joined:
    23 Oct 2009
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    Cпасиб