Спарсить все ссылки с сайта C#

Discussion in 'С/С++, C#, Rust, Swift, Go, Java, Perl, Ruby' started by S[N]EP, 28 Jan 2012.

  1. S[N]EP

    S[N]EP Elder - Старейшина

    Joined:
    29 Aug 2008
    Messages:
    102
    Likes Received:
    28
    Reputations:
    10
    Народ помогите! Нужно выдрать все ссылки с сайта с помощью C#, помогите составить регулярку :)
    я достаю регуляркой:
    Code:
    <a href=\".+\"
    получаю:
    Code:
    <a href="http://mail.ru/" class="logo__link"  
    <a href="http://www.mail.ru/pages/help/11.html" class="sublogonav__item__link" name="cln2407"><span class="sublogonav__item__link__text"  <a href="http://mobile.mail.ru/" class="sublogonav__item__link" name="cln2863" target="_blank"><i class="sublogonav__item__link__icon icon icon_splash icon_mobile"></i><span class="sublogonav__item__link__text"
    и т.д.

    а хотелось бы чисто урлы :)
     
  2. S[N]EP

    S[N]EP Elder - Старейшина

    Joined:
    29 Aug 2008
    Messages:
    102
    Likes Received:
    28
    Reputations:
    10
    хм, у меня все равно:
    Code:
    <a href="http://mail.ru/" class="logo__link"  
    <a href="http://www.mail.ru/pages/help/11.html" class="sublogonav__item__link" name="cln2407"><span class="sublogonav__item__link__text"
     
  3. BigSnake

    BigSnake New Member

    Joined:
    20 Apr 2010
    Messages:
    15
    Likes Received:
    1
    Reputations:
    0
    конструкция .+ у тебя сожрет всю строку до последнего символа "
    PHP:
    <a href="([^"]+)"