Парсер рефератов

Discussion in 'SЕО - тонкости, методы раскрутки' started by Pycckoe1, 19 Sep 2009.

  1. Pycckoe1

    Pycckoe1 Banned

    Joined:
    7 Oct 2008
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    В общем может у кого есть парсер, который парсит рефераты с сайта http://referat.yandex.ru/ или может кто написать может?
     
  2. gisTy

    gisTy Elder - Старейшина

    Joined:
    24 May 2008
    Messages:
    432
    Likes Received:
    160
    Reputations:
    27
    только что накидал..
    это чтобы парсил и выводил в браузер рефераты из раздела астрономия
    PHP:
    <?php
    $site 
    file_get_contents("http://referat.yandex.ru/astronomy.xml"); 
    #меняешь здесь astronomy.xml на нужный тебе(посмотреть их можно на главной, там ссылки будут на разделы)
    preg_match("/margin-left:0;\">(.*)<\/h1>/i"$site$title);
    preg_match_all("/<p>(.*)<\/p>/i"$site$text);

    echo 
    "<b>".$title[1]."</b>\n<br />\n";
    foreach (
    $text[1] as $k => $val)
        echo 
    "<br />".$val."\n";
    ?>
    это чтобы писал в файл с названием - как название реферата и текстом самого реферата внутри:
    PHP:
    <?php
    $site 
    file_get_contents("http://referat.yandex.ru/astronomy.xml"); 
    #меняешь здесь astronomy.xml на нужный тебе(посмотреть их можно на главной, там ссылки будут на разделы)
    preg_match("/margin-left:0;\">(.*)<\/h1>/i"$site$title);
    preg_match_all("/<p>(.*)<\/p>/i"$site$text);
    $fp fopen($title[1]."txt""w");
    fwrite ($fpimplode("\n",$text[1]));
    fclose($fp);
    ?>
     
    #2 gisTy, 19 Sep 2009
    Last edited: 19 Sep 2009