Парсер будущего

Discussion in 'Болталка' started by stalker0007, 23 Apr 2016.

  1. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
    Мужики кто знает:

    Софт, скрипт который будет бегать по ссылкам что я указал и смотреть есть ли на странице допустим слово "google" если есть то good.txt


    у меня свои ссылки есть, мне нужно откинуть сайты в который нету слова facebook по этому нужно загрузить 1000 ссылок и что бы софт прочекал на каких есть слово facebook а на каких нету и дал мне формат линков где есть это слово
     
    #1 stalker0007, 23 Apr 2016
    Last edited: 23 Apr 2016
  2. pravdaru

    pravdaru Member

    Joined:
    5 Dec 2015
    Messages:
    176
    Likes Received:
    47
    Reputations:
    0
    Описан обычный парсер, в чем будущее?)
     
  3. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
    Ну так если имеется такой можешь дать линк пожалуйста?)
     
    pravdaru likes this.
  4. pravdaru

    pravdaru Member

    Joined:
    5 Dec 2015
    Messages:
    176
    Likes Received:
    47
    Reputations:
    0
    По возможности стараюсь не пользоваться чужим софтом(и тебе не советую, без исходных кодов). А если пользуюсь, то запускаю на VM и сниферю че делает.
    Советую самому всё писать, такой скрипт я могу написать. Думаю ты хочешь какие нибудь id сграбить?
     
    Svrld likes this.
  5. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
    нет, мне нужно просто отсортировать те страницы в которых нету слова facebook (и любого другого слова что я укажу)

    1) есть линки 1000+ страниц разных сайтов
    2) есть слово которое должно быть хотя бы на нескольких этих страницах допустим (facebook)
    3) теперь нужно добавить свою базу линков в софт (скрипт) который прочекает все линки на это слово и выдаст мне колонку(txt) те линки где есть слово facebook

    с одно стороны все просто, а с другой тупо нету в паблике ничего такого что бы сразу кинулось и я скачал.
    Хоть бери нанимай программе за пиво....
     
  6. Раrаdох

    Раrаdох Elder - Старейшина

    Joined:
    30 Jan 2014
    Messages:
    95
    Likes Received:
    140
    Reputations:
    33
    За ваши деньги любой каприз. Или вы нищий?
     
  7. shell_c0de

    shell_c0de Hack All World

    Joined:
    7 Jul 2009
    Messages:
    1,180
    Likes Received:
    617
    Reputations:
    690
    intext:бабло site:.ru ???
     
    _________________________
    erwerr2321, Раrаdох and pravdaru like this.
  8. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
    нет я напарсил уже линки, мне просто нужно отсортировать - линках где нету слова facebook они идут в bad, а линки где будет слово facebook идут в good.
    что бы потом где гуды я мог засунуть в свой софт по работе ибо 1000 линков руками смотреть где есть это слово а где нету тупо убийство!
     
  9. pravdaru

    pravdaru Member

    Joined:
    5 Dec 2015
    Messages:
    176
    Likes Received:
    47
    Reputations:
    0
    Какое например, другое слово?))
     
  10. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
    не важно..
     
  11. pravdaru

    pravdaru Member

    Joined:
    5 Dec 2015
    Messages:
    176
    Likes Received:
    47
    Reputations:
    0
    Как мы можем помочь, если не знаем, для чего? Ты объясни куда тебе это надо, может кто скинет код.
     
  12. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
    куда ещё подробнее расписывать.

    просто нужен сортировщик этот, что бы не делать рутинную работу руками при которой уйдет весь день что бы проверить 1000 линков на слово facebook
     
  13. pravdaru

    pravdaru Member

    Joined:
    5 Dec 2015
    Messages:
    176
    Likes Received:
    47
    Reputations:
    0
    приведи пример 2-3 ссылки, и что там искать надо..
     
  14. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
  15. crlf

    crlf Green member

    Joined:
    18 Mar 2016
    Messages:
    683
    Likes Received:
    1,513
    Reputations:
    460
    PHP:
    <?php /* 2016  New Generation Parser by crlf */
    $f array_unique(file('links.txt'FILE_IGNORE_NEW_LINES FILE_SKIP_EMPTY_LINES));
    foreach(
    $f as $l)
      
    file_put_contents((strpos(file_get_contents($l),'fb-comments') ? 'good' 'bad').'.txt'$l."\n"FILE_APPEND);
    ?>
    UPD Сходу просмотрел. Блок с комментами грузится в ифрейме, лучше чекать на наличие "fb-comments" иначе предвижу танцы с бубном вокруг phantomjs. Скрипт подправил.
     
    #15 crlf, 23 Apr 2016
    Last edited: 23 Apr 2016
    M_script, pravdaru, Svrld and 3 others like this.
  16. stalker0007

    stalker0007 Member

    Joined:
    1 Oct 2009
    Messages:
    44
    Likes Received:
    20
    Reputations:
    0
    Большое спасибо мужик!!!
     
    pravdaru likes this.
  17. ol1ver

    ol1ver Active Member

    Joined:
    22 Jul 2011
    Messages:
    237
    Likes Received:
    155
    Reputations:
    0
    Content downloader
     
  18. pravdaru

    pravdaru Member

    Joined:
    5 Dec 2015
    Messages:
    176
    Likes Received:
    47
    Reputations:
    0
    Видишь, привёл пример, всё сразу сделали)
     
  19. Mansoni

    Mansoni Member

    Joined:
    10 Mar 2016
    Messages:
    26
    Likes Received:
    12
    Reputations:
    1
    Зенопостер в помощь