Граб с страниц вида site/all и тд.

Discussion in 'PHP' started by Fanat3, 27 Jun 2011.

  1. Fanat3

    Fanat3 New Member

    Joined:
    20 Oct 2009
    Messages:
    1
    Likes Received:
    0
    Reputations:
    0
    Подскажите пожалуйста как парсить с сайтов где ссылки вида site/all/ , дальше site/all/oven/ и т.д. Сайт на мод рэврайт. И вообще как парсит сайты на мод реврайт? Извините, если не там создал тему. Я новичек.
     
  2. miako

    miako Member

    Joined:
    20 Jan 2010
    Messages:
    154
    Likes Received:
    13
    Reputations:
    5
    Что значит как? Как и обычно: file_get_contents("http://www.sample.com/site/all")
     
  3. Fuckel

    Fuckel Banned

    Joined:
    16 Jan 2008
    Messages:
    274
    Likes Received:
    59
    Reputations:
    6
    Парсить как и обычно, но обходить все страницы - это уже другой вопрос. На небольших сайтах урл http://sample.com/site/all/foo/bar , как показывает практика использования фреймоворков, можно разделить на домен - sample.com, модуль - site, foo - контроллер, bar - метод, все остальное это параметры метода. Все модули, контроллеры и тд удобно парсить с гугла(у Madnet'а была утилита, которая парсит дерево сайта).