нет не кажется, у вас тут на дню возникает тьма простых вопросов - перечитать ветку не больше часа - ответов тьма, вопросы отпадут...
я обычно так делаю: inurl:map1.html "тематический ключ" inurl:sitemap1.html "тематический ключ" и конечно можно еще дату поставить , а так же проверить сайт на уязы + попробывать брутануть тдску если она есть(геморой) и увести весь траффик
Откуда можно спарсить кол-во стр которые находятьгся в индексе яши? С главной не вариант, оч часто капча вылазит таймаут\прокси мало помогают..
да нахрена этот геморрой нужен с разными парсерами.... накачал из торентов или из п2п сетей книжек в fb2 , сконвертил их в тхт через fb2toany, почистил его и всё... яндекс прекрасно жрёт и индексит доры так...
а нахрена этот гемморой с торрентами, п2п сетями, книжками fb2 и конверсией в тхт через fb2toany? может проще напарсить и почистить?
ну кому как... по мне быстрее и проще как-то по старинке будет, скачать + сконвертить и почистить базу , гигов на 8, чем парсить ресы,когдп ещё нету нормальный парсеров...