http://webcache.googleusercontent.com/search?sclient=psy-ab&hl=ru&site=&gbv=1&sei=Q_IWT-PNEar10gHT5LDWAg&q=cache:d-0rPJ-quIMJ:http://genecenter.hunter.cuny.edu/index.php/component/content/article/6-bioinformatics/112-greenbaum-steven-g.html+Buy+viagra+in+bangkok+pharmacy&ct=clnk http://webcache.googleusercontent.com/search?sclient=psy-ab&hl=ru&site=&q=cache:t1iBewjDDW8J:http://sportscurmudgeon.com/blog/2007/09/+http%3A//sportscurmudgeon.com/blog/2007/09/&ct=clnk http://webcache.googleusercontent.com/search?sclient=psy-ab&hl=ru&site=&q=cache:xbs8EGoaYHgJ:http://www.urbanlowdown.com/destinations/scotland/glasgow/+http%3A//www.urbanlowdown.com/destinations/scotland/glasgow/&ct=clnk подскажите плиз
)) пхп код который выполняется с сервера скорее всего непосмотреть никак, без досутпа к самому серверу
Не кликал по линкам, но если там в шапке посылается локейшн или рефреш - то сниффается тем же плагином для firefox - LiveHTTPHeaders
Клоакинг, то есть как кто-то выше написал пхп скрипт, который отслеживает кто обращается к странице и откуда, если с поисковика пришли по запросу buy viagra выдает аптеку, если робот зашел выдает страницу дорвея, если посетитель данного сайта, то оригинальную страницу. Сейчас такими дорвеями весь фарма топ забит.
ап тему, кто подскажет где такой найти, купить, заказать тоже ищу, очень надо. заранее Благодарен! Зы скиньте контакты в ЛС кто знает.
Code: // массив юзерагентов $user_agent_to_filter = array( '#Ask\s*Jeeves#i', '#HP\s*Web\s*PrintSmart#i', '#HTTrack#i', '#IDBot#i', '#Indy\s*Library#', '#ListChecker#i', '#MSIECrawler#i', '#NetCache#i', '#Nutch#i', '#RPT-HTTPClient#i', '#rulinki\.ru#i', '#Twiceler#i', '#WebAlta#i', '#Webster\s*Pro#i','#www\.cys\.ru#i', '#Wysigot#i', '#Yahoo!\s*Slurp#i', '#Yeti#i', '#Accoona#i', '#CazoodleBot#i', '#CFNetwork#i', '#ConveraCrawler#i','#DISCo#i', '#Download\s*Master#i', '#FAST\s*MetaWeb\s*Crawler#i', '#Flexum\s*spider#i', '#Gigabot#i', '#HTMLParser#i', '#ia_archiver#i', '#ichiro#i', '#IRLbot#i', '#Java#i', '#km\.ru\s*bot#i', '#kmSearchBot#i', '#libwww-perl#i', '#Lupa\.ru#i', '#LWP::Simple#i', '#lwp-trivial#i', '#Missigua#i', '#MJ12bot#i', '#Mozilla\/5\.0#i', '#msnbot#i', '#msnbot-media#i', '#Offline\s*Explorer#i', '#OmniExplorer_Bot#i', '#PEAR#i', '#psbot#i', '#Python#i', '#rulinki\.ru#i', '#SMILE#i', '#Speedy#i', '#Teleport\s*Pro#i', '#TurtleScanner#i', '#User-Agent#i', '#voyager#i', '#Webalta#i', '#WebCopier#i', '#WebData#i', '#WebZIP#i', '#Wget#i', '#Yandex#i', '#Yanga#i', '#Yeti#i','#msnbot#i', '#spider#i', '#yahoo#i', '#jeeves#i' ,'#google#i' ,'#altavista#i', '#scooter#i' ,'#av\s*fetch#i' ,'#asterias#i' ,'#spiderthread revision#i' ,'#sqworm#i', '#ask#i' ,'#lycos.spider#i' ,'#infoseek sidewinder#i' ,'#ultraseek#i' ,'#polybot#i', '#webcrawler#i', '#robozill#i', '#gulliver#i', '#architextspider#i', '#yahoo!\s*slurp#i', '#charlotte#i', '#ngb#i' ) ; if ( !empty( $_SERVER['HTTP_USER_AGENT'] ) && ( FALSE !== strpos( preg_replace( $user_agent_to_filter, '-NO-WAY-', $_SERVER['HTTP_USER_AGENT'] ), '-NO-WAY-' ) ) ) echo 'держи барашку :)' ; else echo 'redirect...' ; Если у вас UNIX-сервер, то следует попробовать вычислить гуглобота так: Code: if( FALSE !== strpos( gethostbyaddr($_SERVER['REMOTE_ADDR']), 'google')) { // это бот } else { // это не бот. } Вот несколько диапазонов поисковых ботов Code: $stop_ips_masks = array( "66\.249\.[6-9][0-9]\.[0-9]+", // Google NetRange: 66.249.64.0 - 66.249.95.255 "74\.125\.[0-9]+\.[0-9]+", // Google NetRange: 74.125.0.0 - 74.125.255.255 "65\.5[2-5]\.[0-9]+\.[0-9]+", // MSN NetRange: 65.52.0.0 - 65.55.255.255, "74\.6\.[0-9]+\.[0-9]+", // Yahoo NetRange: 74.6.0.0 - 74.6.255.255 "67\.195\.[0-9]+\.[0-9]+", // Yahoo#2 NetRange: 67.195.0.0 - 67.195.255.255 "72\.30\.[0-9]+\.[0-9]+", // Yahoo#3 NetRange: 72.30.0.0 - 72.30.255.255 "38\.[0-9]+\.[0-9]+\.[0-9]+", // Cuill: NetRange: 38.0.0.0 - 38.255.255.255 "93\.172\.94\.227", // MacFinder "212\.100\.250\.218", // Wells Search II "71\.165\.223\.134", // Indy Library "70\.91\.180\.25", "65\.93\.62\.242", "74\.193\.246\.129", "213\.144\.15\.38", "195\.92\.229\.2", "70\.50\.189\.191", "218\.28\.88\.99", "165\.160\.2\.20", "89\.122\.224\.230", "66\.230\.175\.124", "218\.18\.174\.27", "65\.33\.87\.94", "67\.210\.111\.241", "81\.135\.175\.70", "64\.69\.34\.134", "89\.149\.253\.169" ); foreach ( $stop_ips_masks as $k=>$v ) { if ( preg_match( '#^'.$v.'$#', $_SERVER['REMOTE_ADDR'])) { echo 'bot detected' ; } }
Без свежей базы ip ботов эти скрипты клоачные до одного места. Боты гугла давно уже лазиют с обычными юзер агентами.