Мужики кто знает: Софт, скрипт который будет бегать по ссылкам что я указал и смотреть есть ли на странице допустим слово "google" если есть то good.txt у меня свои ссылки есть, мне нужно откинуть сайты в который нету слова facebook по этому нужно загрузить 1000 ссылок и что бы софт прочекал на каких есть слово facebook а на каких нету и дал мне формат линков где есть это слово
По возможности стараюсь не пользоваться чужим софтом(и тебе не советую, без исходных кодов). А если пользуюсь, то запускаю на VM и сниферю че делает. Советую самому всё писать, такой скрипт я могу написать. Думаю ты хочешь какие нибудь id сграбить?
нет, мне нужно просто отсортировать те страницы в которых нету слова facebook (и любого другого слова что я укажу) 1) есть линки 1000+ страниц разных сайтов 2) есть слово которое должно быть хотя бы на нескольких этих страницах допустим (facebook) 3) теперь нужно добавить свою базу линков в софт (скрипт) который прочекает все линки на это слово и выдаст мне колонку(txt) те линки где есть слово facebook с одно стороны все просто, а с другой тупо нету в паблике ничего такого что бы сразу кинулось и я скачал. Хоть бери нанимай программе за пиво....
нет я напарсил уже линки, мне просто нужно отсортировать - линках где нету слова facebook они идут в bad, а линки где будет слово facebook идут в good. что бы потом где гуды я мог засунуть в свой софт по работе ибо 1000 линков руками смотреть где есть это слово а где нету тупо убийство!
куда ещё подробнее расписывать. просто нужен сортировщик этот, что бы не делать рутинную работу руками при которой уйдет весь день что бы проверить 1000 линков на слово facebook
http://www.wkyc.com/news/local/cleveland/dancing-to-raise-money-for-cancer-research/127840517 http://teamcoco.com/video/lil-dicky-feat-rich-homie-quan-01-05-16 Искать должно "Facebook Comments Plugin" если на сайте этот текст (код присутствует то good.txt если нет то bad.txt) и так ссылок 1000++
PHP: <?php /* 2016 New Generation Parser by crlf */$f = array_unique(file('links.txt', FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES));foreach($f as $l) file_put_contents((strpos(file_get_contents($l),'fb-comments') ? 'good' : 'bad').'.txt', $l."\n", FILE_APPEND);?> UPD Сходу просмотрел. Блок с комментами грузится в ифрейме, лучше чекать на наличие "fb-comments" иначе предвижу танцы с бубном вокруг phantomjs. Скрипт подправил.