Парсер

Discussion in 'PHP' started by Велемир, 28 Jan 2009.

  1. Велемир

    Joined:
    19 Jun 2006
    Messages:
    1,123
    Likes Received:
    96
    Reputations:
    -25
    Есть у кого парсер www.rabota.ru ? Или как такой написать ? Ниче в голову не приходит =_=
     
  2. D Mak

    D Mak Elder - Старейшина

    Joined:
    23 Jun 2007
    Messages:
    136
    Likes Received:
    27
    Reputations:
    0
    что именно надо парсить? могу написать на пхп
     
  3. kik8888

    kik8888 Elder - Старейшина

    Joined:
    29 Feb 2008
    Messages:
    45
    Likes Received:
    6
    Reputations:
    -4
    Открываешь html код страницы изучаешь между какими неповторьящимися в других местах структурами находится то, что нужно парсить.
    Отправляешь запрос на эту страницу и с помощью функции работы со строками вытаскиваешь то что нужно и сохраняешь как нужно.
    Если то что нужно парсить находится на разных страницах смотришь в коде как меняются страницы и организовываешь все запросы с вытаскиванием нужного (каждый для каждой страницы) в цикле.
    Вот и весь принцип работы, пиши, повышай свой уровень знаний, а он повышается только на практике.
     
  4. mailbrush

    mailbrush Well-Known Member

    Joined:
    24 Jun 2008
    Messages:
    1,997
    Likes Received:
    996
    Reputations:
    155
    стукай в аську, либо пиши тут, что именно написать надо...
     
  5. diehard

    diehard Elder - Старейшина

    Joined:
    30 Sep 2007
    Messages:
    442
    Likes Received:
    266
    Reputations:
    15
    Ничего не приходит в голову? Начни читать с php.net
     
  6. mailbrush

    mailbrush Well-Known Member

    Joined:
    24 Jun 2008
    Messages:
    1,997
    Likes Received:
    996
    Reputations:
    155
    Может ТС имеет ввиду фейк?
     
  7. Pashkela

    Pashkela Динозавр

    Joined:
    10 Jan 2008
    Messages:
    2,750
    Likes Received:
    1,044
    Reputations:
    339
    Как чего? Работу, должности, зарплату и всё автоматически:)
     
  8. Велемир

    Joined:
    19 Jun 2006
    Messages:
    1,123
    Likes Received:
    96
    Reputations:
    -25
    Угу:)))Прошу прощения,что не отвечал,тут ачат не грузился вообще =_=.Спарсить я хотел содержимое конкретных тегов хтмл...но чёт не выходит =_= Вот,начал набрасывать:

    <?php
    $s = array();
    $fp = fsockopen ("www.rabota.ru", 80, $errno, $errstr, 30);
    if(!$fp) {
    echo $errstr;
    } else {
    fwrite($fp, "GET / HTTP/1.1\r\nHost: www.rabota.ru\r\nConnection: Keep-Alive\r\n\r\n");
    $data = '';
    while(!feof($fp)) {
    $data .= fread($fp, 4096);

    }
    }

    $x = trim($data);
    $s = explode("<option value=",$x);
    $d = fopen("C:\Program Files\VertrigoServ\www\ga.txt",w);
    if($d) {

    for($i = 0;$i<count($s);$i++) {
    fwrite($d,$s[$i]);
    }
    fclose($d);

    }


    ?>

    Эт своего рода псевдокод,так как там хватает ошибок:).Как вариант можно слить страницу на винт и там как-то вытащить данные...Но среди этой кучи мусора я не знаю (.Сайт Работы просто выбрал).
     
  9. Pashkela

    Pashkela Динозавр

    Joined:
    10 Jan 2008
    Messages:
    2,750
    Likes Received:
    1,044
    Reputations:
    339
    Неправильный подход. Или понимание того, как надо спрашивать. А спрашивать надо так:

    Вот есть страница такая-то (точный урл), как мне с неё спарсить такие-то данные:

    1. Название огранизации-работодателя
    2. Контактный телефон
    3.....
     
  10. vikseriq

    vikseriq Elder - Старейшина

    Joined:
    31 Jul 2008
    Messages:
    118
    Likes Received:
    44
    Reputations:
    2
    ТС, стукни - расскажу и продвину ) И определись точнее, что хочешь парсить: свежее, определенный город/профессию/пол Не стейняйся. Про опыт правду сказали.