ВОПРОСЫ по books.google.com

Discussion in 'PHP' started by burcev, 21 Jan 2009.

  1. burcev

    burcev New Member

    Joined:
    30 Jun 2008
    Messages:
    26
    Likes Received:
    1
    Reputations:
    0
    Сразу к делу. Имеется вот такая книга http://books.google.com/books?id=FlxlMVsnIB8C&printsec=frontcover&hl=uk#PPP1,M1 .
    Задача: нужно с помощью каких-то скриптов(если такие имеются, или хотя бы теорию как его можно сделать) "вытащить" этот pdf или картинки(страницы).

    Заранее благодарен за помощь.
     
  2. lisa99

    lisa99 Banned

    Joined:
    15 Jul 2008
    Messages:
    359
    Likes Received:
    200
    Reputations:
    70
    Там не нужны скрипты...
    pdf ты не вытащишь, реально оставить только jpg
    Спарсить картинки не проблема даже ручками.

    В твоем случае у тебя это
    http://books.google.com/books?id=FlxlMVsnIB8C&pg=PP1&img=1&zoom=3&hl=uk&sig=ACfU3U1xUt_O1SNwGi4pwWs_VFZEfs6Nrw

    Я взяла это из исходного текста страницы

    в любой враузер, затем сохранить как гипертекст с рисунками- и вуаля- в папочке будут только страницы.

    А еще лучше- поставь ФФ с плагинами сохранения мультимедийного контента. те заточены вытаскивать все.
     
  3. Pashkela

    Pashkela Динозавр

    Joined:
    10 Jan 2008
    Messages:
    2,750
    Likes Received:
    1,044
    Reputations:
    339
    Там все-равно ограничение на кол-во страниц, всю книжку так не спарсишь