Небольшая програмка на С, парсит линки гугла по запросам и пишет в файл Пример использования: goog.exe [запрос][количество линков][стартовая страница] Example: goog.exe test 100 0 Example: goog.exe allinurl:res.php 20 0 http://gfs-team.ru/?act=downloads&id=192 сурсы внутри
для домашнего использования - вешь ормальная, а вот для глабвльных действий трафа жалко. Поэтому я юзаю php скрипт который парсит google
не, в принципе если чуть чуть одифрцировать, а именно брать сайт, с него брать все линки, качать страницы и парсить на мыла(http://gfs-team.ru/?act=articles&pact=37) то можно сделать чтото подобное
2 Robin_Hood дык тоже самое можно делать для создания дорвеев. ТОка там придется брать не мыла, а саму страницу. но всеже на домашних компах не рафионально это делать.
да нормально все на хоум тачках, сейчас траф у многих анлим - раз, и два - если ты не нуб в сео, то лавэ на траф будет полюбому, и ты и я об этом знаем
В allsubmitter есть функция парсинга линков. вот статья по теме http://somedate.net/board/showthread.php?t=31
Code: function searchgoogle( $search, $start ) { GLOBAL $google_host, $gfrom, $gto; $start = intval( $start ); $ret = ""; $u = "http://$google_host/search?q=".urlencode( $search )."&num=100&start=$start"; $f = @fopen( $u, "r" ); if (!$f) { // Google connection failed return 0; } $data = ""; while (!feof( $f )) $data .= fread( $f, 1024 ); fclose( $f ); preg_match_all( "/<p class=g><a class=l href=\"(.*)\">/U", $data, $links, PREG_SET_ORDER ); foreach( $links as $l ) $ret .= $l[1]."\r\n"; if (!preg_match_all( "/ <b>([0-9]*)<\/b> - <b>([0-9]*)<\/b> /U", $data, $fromto, PREG_SET_ORDER )) { sleep( 2 ); return 0; } $results_from = intval( $fromto[0][1] ); $results_to = intval( $fromto[0][2] ); if ($results_from && $results_to && ($results_to - $results_from == 99)) { if ($gfrom && $gto) sleep( rand( $gfrom, $gto ) ); else sleep( 5, 15 ); $ret .= searchgoogle( $search, $results_from+99 ); } return $ret; } print searchgoogle( "skachat berkovu porno dom2" );
preg_match_all( "/<p class=g><a class=l href=\"(.*)\">/U", $data, $links, PREG_SET_ORDER ); дык так гораздо проще + нету фильтрации на мусор который выдает гугл, линки на его сервиисы.
Теперь я сно чем народ в гугле занимается Сори за оффтоп. А вот мне по вкусу вот такой вот код: preg_match_all("|<a\s[^>]*?href\s*=\s*[\'\"]?(http://[^\s\'\">]+)[\s\'\"]?[^>]*?>(.+?)</a>|si", $content, $matches);