Привет, нужно проиндексировать доры через индексатор и для этого нужно напарсить с дора ссылок вида <a href="www.dor.ru/file/kriak-skachat.html">кряк скачать</a> Чем это можно сделать?
А дорген не оставляет ссылки при генерации? Можно собрать ссылки из карты дора *.html или *.xml, если ты использовал создание карты.
Можешь и бегать, а можно на каждый шелл скрипт закидывать который все это сделает. Можно все это автоматизировать.
Какой дорген используешь?У red.Button. TRANSFORMER во вкладке "глянем" есть ссылка на Смотреть ссылки для спама → Могу предложить скрипт на perl сбора ссылок с сайтов.
#!/usr/bin/perl -w # http://docstore.mik.ua/orelly/perl/cookbook/ch20_01.htm # example: perl ./extract_website_url.pl http://www.russia.ru/rss/ > url.txt use HTML::LinkExtor; use LWP::Simple; $base_url = shift; $parser = HTML::LinkExtor->new(undef, $base_url); $parser->parse(get($base_url))->eof; @links = $parser->links; foreach $linkarray (@links) { my @element = @$linkarray; my $elt_type = shift @element; while (@element) { my ($attr_name , $attr_value) = splice(@element, 0, 2); $seen{$attr_value}++; } } for (sort keys %seen) { print $_, "\n" }