Парсер Яндекс.Весны Программа писалась скорее для себя, но вполне удобна и стабилна. Возможности Парсинг сразу нескольких текстов Работа под всеми ОС (где есть питон) Авто-удаление параграфов (отключаемое) Разделение текстов произвольными словами Использование Необходим установленный Pyton 3 ! Запускаем vesna-parser.py, в папке out (через некоторое время) появляется файл 1.txt с спарсеными текстами. Если файл 1.txt уже есть то появляется 2.txt итд Настройка Открываем vesna-parser.py в текстовом редакторе, и там все написано. Скачать c Narod Скачать с slil PS Перл весны: «Лазерный интеграл от переменной величины — актуальная национальная задача» PPS Кто попользовался пожалуйста напишите отзыв !
Парсер Весна?! Вау! Круто! А чего не Лето?! =)) Ну а честно ща спалю тему всем кто читает сей пост.. )) Парсить можно все что угондно и даже выдача контакат может круто отвечать низакочастотным запросам.. Так что я бы посоветовал топикастору глядеть более просторно..
sb2k Я посоветовал бы, перед тем как отвечать читать инфу. Я.Весна генератор человеко подобного текста. По отзывам поисковики отлично воспринимают доры на нем. Но 1) Я.Весна бесконечна, в отличии от контакта 2) Я.Весна горааздо проще и быстрее парсить 3) Текст примерно одинаков и стабилен Я надеюсь плюсов достаточно ? Ну и конечно сам текст не должен дыть оптимизирован под НЧ, как вы сказали. Для этого есть вставка кеев
shuba Я знаю, но во превых мой софтработает под линем и во вторых, насколько я помню в SMParserе было ограничение в 1000 на кол-во текстов за раз.
тс, залей на слил.ру не качает с народа -=-=-=-=-=-=-=-=-=- отличный парсер! под линем шустро пашет спасибо тс
hirsh Кодировки правильные ? Если да, то меняем символы после "=" сообразно коментариям. Что конкретно непонятно ?
Непонятно в принципе все. Какие кодировки ты/вы имеешь ввиду? Скачал как есть архив. Открыл vesna-parser.py и честно сказать ничего там не понял. Открываю этот файл питоном, появляется просто экран, ничего не нельзя ввести. з.ы. Сильно не пинайте только. Знал бы не писал бы.
А ничего не должно писаться. Просто появляется спарсенный текст в папке out. Щас напишу инструкцию по всем параметрам, подожди чуть чуть.
FAQ по настройке: Code: COUNT = 100 # Сколько раз парсить Вместо 100 пишем сколько текстов весны надо спарсить за один раз. Каждый текст 3 небольших абзаца. Code: BETWEEN = "" # Разделитель склейки спарсенных текстов Каждый пасинг COUNT текстов пихаются в один файл. Если вы хотите их чем нибудь разделить, то вставте этот текст между кавычек. Code: DELETE_P = True # Удалять "<p>" Если вы пихаете напиример спарсенный текст в дорвеи, то теги параграфов раставляемые Яндексом вам будут мешать. Есле же вам нужно исходное форматирование текста, то замените True на False Code: SLEEP = 0 # Пауза Я лично такого не видел, но говорят, что Яндекс может банить ip за много запросов к нему. В SLEEP указывается промежуток между запросами (в секундах)
Оказывается просто надо было подождать, пока окно само закроется. Я же не дождавшись закрывал его. Спасибо за мануал все стало намного понятнее. Ты писал, что по отзывам поисковики отлично воспринимают доры на нем. Так вот, текст этот может так и оставить или все же перемешать? И еще где-то читал, что для дора лучше использовать текст близкий к тематике дора, тут же выходит текст из рефератов из других тематик. Или тот факт, что все это находится на под домене яндекса дает траст дору с любой тематикой?
hirsh По дорам я не специалист. Но точно могу сказать, то траста это не даст. Если бы Я помнил, что он генерирует он сошел бы с ума. А тематичность - фигня. Намешанные ключевики и так хорошо указывают тематику.