спарсить записи вк

Discussion in 'PHP' started by skrutcher, 6 Feb 2013.

  1. skrutcher

    skrutcher New Member

    Joined:
    17 Jul 2011
    Messages:
    17
    Likes Received:
    1
    Reputations:
    0
    приветствую.
    не получается спарсить записи со стены вк, именно чтобы не только запись выходила а от тега <div class="wall_text"> до <div class="reply_table">

    PHP:
    preg_match_all('|<div class="wall_text">(.*)<div class="reply_table">|is'
    пробовал добавлять другие теги которые рядом
    если
    |<div class="wall_text">(.*)|is
    то парсить от нужного тега, а до нужного никак
     
  2. Redfern89

    Redfern89 New Member

    Joined:
    12 Jul 2012
    Messages:
    42
    Likes Received:
    1
    Reputations:
    -3
    simple_html_dom ;) не пробовали?)
     
  3. skrutcher

    skrutcher New Member

    Joined:
    17 Jul 2011
    Messages:
    17
    Likes Received:
    1
    Reputations:
    0
    да
    ничего
     
  4. kroŧ

    kroŧ Member

    Joined:
    19 May 2010
    Messages:
    129
    Likes Received:
    33
    Reputations:
    8
    Code:
    <div class="wall_text">\s*(.+)\s*<div class="reply_table">
    Если так?
     
  5. skrutcher

    skrutcher New Member

    Joined:
    17 Jul 2011
    Messages:
    17
    Likes Received:
    1
    Reputations:
    0
    /<div class="wall_text">\s*(.+)\s*<div class="reply_table">/

    неа, без слешей ошибка
     
  6. kroŧ

    kroŧ Member

    Joined:
    19 May 2010
    Messages:
    129
    Likes Received:
    33
    Reputations:
    8
    Ну понятно ошибка я ведь только регулярку написал.
    Если там между тегом div нет других тегов тогда (.+) можно заменить на ([^<>]+)
    PHP:
    $text='
    <div class="wall_text">
    text1
    <div class="reply_table"><div class="wall_text"> tex  t2<div class="reply_table">'
    ;
    preg_match_all('#<div class="wall_text">\s*(.+)\s*<div class="reply_table">#i',$text,$ar);
    print_r($ar[1]);
    Если не работает то приведите пример текста(можно в лс) с которого нужно парсить, составлю регулярное выражение, во Вк не зарегистрирован.
     
  7. VKAPI

    VKAPI Member

    Joined:
    25 Nov 2011
    Messages:
    142
    Likes Received:
    68
    Reputations:
    0
    [​IMG]

    [​IMG]
     
    #7 VKAPI, 7 Feb 2013
    Last edited: 7 Feb 2013
  8. skrutcher

    skrutcher New Member

    Joined:
    17 Jul 2011
    Messages:
    17
    Likes Received:
    1
    Reputations:
    0
    kroŧ, пример vk.com/mudakoff авторизация не нужна.
    VKAPI никак.

    не о один пример не сработал
    массив пуст\
     
  9. maxim2142

    maxim2142 Member

    Joined:
    31 May 2010
    Messages:
    16
    Likes Received:
    10
    Reputations:
    3
    Если я правильно тебя понял то вот так тебе стоило сделать, вообще просматривай исходники вк через echo $html;.
    PHP:
    <?
    include 
    'simple_html_dom.php';

    $html file_get_html('http://m.vk.com/mudakoff?offset=10&own=1');

     
    //echo $html;
    foreach($html->find('div[class="cont"] div[class="medias"]') as $element
           echo 
    $element'<br>';
    ?>
     
    #9 maxim2142, 9 Feb 2013
    Last edited: 9 Feb 2013
  10. proroot

    proroot Member

    Joined:
    31 Jan 2012
    Messages:
    46
    Likes Received:
    5
    Reputations:
    0
    Лучше сделать, все это через API VK. Если не хочешь, то попробуй через curl + user-agent, они вроде проверяют..
     
  11. skrutcher

    skrutcher New Member

    Joined:
    17 Jul 2011
    Messages:
    17
    Likes Received:
    1
    Reputations:
    0
    о отлично,записи вывело.
    а как на счет полного того что хотел:
    т.е. например вот часть
    Code:
    <div class="cont"> <div class="ch"> <div><a class="author al_p10639516 _p10639516" href="/mudakoff">MDK</a> </div> </div> <div class="cc"> <div class="medias audios_list"> <div class="thumbs"><div class="pv photo"><a href="/photo-10639516_297618762?rev=1&post=-10639516_13559460&from=profile" class="al_photo"><img src="http://cs7003.userapi.com/c7002/v7002018/2aef/rsHBv_3cEi4.jpg" data-photo="http://cs7003.userapi.com/c7002/v7002018/2af0/-RyUvGBAJOw.jpg|604|84" /></a></div><div class="cb"></div></div> </div> <div class="info"><a class="date al_post" href="/wall-10639516_13559460" data-header="Страница">сегодня в 16:13</a><a href="/like?act=members&object=wall-10639516_13559460&from=mudakoff%3Foffset%3D10%26own%3D1" class="like i"><i></i><b>6<span class="num_delim"> </span>387</b></a><span class="repost" style="display:none"></span><span class="replies"><i></i><b>228</b></span></div> <div class="links"><span class="like_wrap"><a href="/like?act=add&object=wall-10639516_13559460&from=mudakoff%3Foffset%3D10%26own%3D1&hash=17fab255efa84ef8de" onclick="return ajax.click(this, Like);">Мне нравится</a></span> - <a class="replies_link al_post" href="/wall-10639516_13559460#comments" data-header="Страница">228 комментариев</a></div> </div> </div>