Черные методы раскрутки Напарсить ссылок с дорвея для индексатора

Discussion in 'SЕО - тонкости, методы раскрутки' started by sonic, 7 Jun 2013.

  1. sonic

    sonic Member

    Joined:
    20 Jun 2010
    Messages:
    305
    Likes Received:
    8
    Reputations:
    0
    Привет, нужно проиндексировать доры через индексатор и для этого нужно напарсить с дора ссылок вида <a href="www.dor.ru/file/kriak-skachat.html">кряк скачать</a>

    Чем это можно сделать?
     
  2. mironich

    mironich Elder - Старейшина

    Joined:
    27 Feb 2011
    Messages:
    733
    Likes Received:
    73
    Reputations:
    19
    Собрать все .html файлы из папки с дором потом добавить к ним домен?
     
  3. sonic

    sonic Member

    Joined:
    20 Jun 2010
    Messages:
    305
    Likes Received:
    8
    Reputations:
    0

    ты предлагаешь мне бегать по шеллам и собирать файлы?
     
  4. Uspeshniy

    Uspeshniy New Member

    Joined:
    7 Mar 2013
    Messages:
    5
    Likes Received:
    0
    Reputations:
    0
    А дорген не оставляет ссылки при генерации? Можно собрать ссылки из карты дора *.html или *.xml, если ты использовал создание карты.
     
  5. mironich

    mironich Elder - Старейшина

    Joined:
    27 Feb 2011
    Messages:
    733
    Likes Received:
    73
    Reputations:
    19
    Можешь и бегать, а можно на каждый шелл скрипт закидывать который все это сделает.
    Можно все это автоматизировать.
     
  6. shuba

    shuba Elder - Старейшина

    Joined:
    22 May 2009
    Messages:
    593
    Likes Received:
    129
    Reputations:
    52
    вообще то дорген оставляет ссылки на сгенерированные доры
     
  7. INdexoiD

    INdexoiD Member

    Joined:
    18 Jun 2010
    Messages:
    93
    Likes Received:
    7
    Reputations:
    -4
    Какой дорген используешь?У red.Button. TRANSFORMER во вкладке "глянем" есть ссылка на Смотреть ссылки для спама → Могу предложить скрипт на perl сбора ссылок с сайтов.
     
  8. INdexoiD

    INdexoiD Member

    Joined:
    18 Jun 2010
    Messages:
    93
    Likes Received:
    7
    Reputations:
    -4
    #!/usr/bin/perl -w
    # http://docstore.mik.ua/orelly/perl/cookbook/ch20_01.htm
    # example: perl ./extract_website_url.pl http://www.russia.ru/rss/ > url.txt
    use HTML::LinkExtor;
    use LWP::Simple;

    $base_url = shift;
    $parser = HTML::LinkExtor->new(undef, $base_url);
    $parser->parse(get($base_url))->eof;
    @links = $parser->links;
    foreach $linkarray (@links) {
    my @element = @$linkarray;
    my $elt_type = shift @element;
    while (@element) {
    my ($attr_name , $attr_value) = splice(@element, 0, 2);
    $seen{$attr_value}++;
    }
    }
    for (sort keys %seen) { print $_, "\n" }
     
    #8 INdexoiD, 8 Jun 2013
    Last edited: 8 Jun 2013