ВОПРОСЫ по books.google.com

burcev · 21 Jan 2009

Сразу к делу. Имеется вот такая книга http://books.google.com/books?id=FlxlMVsnIB8C&printsec=frontcover&hl=uk#PPP1,M1 .
Задача: нужно с помощью каких-то скриптов(если такие имеются, или хотя бы теорию как его можно сделать) "вытащить" этот pdf или картинки(страницы).

Заранее благодарен за помощь.

lisa99 · 22 Jan 2009

Там не нужны скрипты...
pdf ты не вытащишь, реально оставить только jpg
Спарсить картинки не проблема даже ручками.

В твоем случае у тебя это
http://books.google.com/books?id=FlxlMVsnIB8C&pg=PP1&img=1&zoom=3&hl=uk&sig=ACfU3U1xUt_O1SNwGi4pwWs_VFZEfs6Nrw

Я взяла это из исходного текста страницы

в любой враузер, затем сохранить как гипертекст с рисунками- и вуаля- в папочке будут только страницы.

А еще лучше- поставь ФФ с плагинами сохранения мультимедийного контента. те заточены вытаскивать все.

Pashkela · 22 Jan 2009

Там все-равно ограничение на кол-во страниц, всю книжку так не спарсишь

ВОПРОСЫ по books.google.com

burcev New Member

lisa99 Banned

Pashkela Динозавр

Useful Searches

ВОПРОСЫ по books.google.com

burcev New Member

lisa99 Banned

Pashkela Динозавр