Ребята, приведите пожалуйста пример простого парсера,который выдирает все из <title>(.*)</title>. ЗЫ: С пыхой дружу, но решил переходить на многопоточность Заранее благодарен
Code: #!/usr/bin/perl -w use locale; $text = "<html>asda dddddasd<title>9asdfasd asdf asd asdf asdff asdfff 111</title>sadf</html>"; $text=~m/<title>(.*)<\/title>/ig; print $1; В переменной $1 будет все что тебя интересует. Чтобы не было проблем с русским языком имеет смысл включить locale
Я знаю как это на php сделать: PHP: $text=file_get_contents('http://google.com'); preg_match('#<title>(.*)</title>#',$text,$out); echo $out[1]; Вот мне нужно тоже самое,только на PERL То есть обязательно грабить с сайта Я в перле не бум-бум ,извините. Спасибо заранее
budden, прикрепи к своему сообщению готовый файл для парсинга, чтобы мне его самому не писать. Или лучше в личку. Тебе рабочий код нужен или идея?
Code: #!/usr/bin/perl use LWP::Simple; $content = get("http://www.mail.ru/"); die "Couldn't get it!" unless defined $content; $content =~ m/<title>(.*?)<\/title>/img; print $1; Пользуйся на здоровье! Магазин ВМ
Разобрался. . У меня было примерно так: Почему то жестко ступил и во всем скрипте вместо http://localhost/ написал localhost
Вобщем нужна помощь с учебником по perl скачал учебник называется "perel за 24 часа" Ну почему я выбрал именно этот и так понятно, но как оказалось не все так просто прочитал пол учебника а толку реально 0 сам мало чего могу написать максимум это представление что такое perl. Посоветуйте учебник для новичка чтобы понятно было а не как там.
Да я уже скачал книгу "Perl. Специальный справочник" уже первые 2 части разобрал вроде более мение понятно но все же не все. Но думаю понимание будет когда прочитаю весь учебник.
Понимание придет только после того как начнешь програмить =)) Чтение эт конечно хорошо, но мое предпочтение будет намного больше к практику нежели к теоретику =)) Я думаю так и у всех =)
как заставить перл воспринять расширение .php.xl Чтобы он открывал его через LWP::UserAgent как обычное .php ??
ph1l1ster, если ты открываешь через LWP::UserAgent файл на другом серваке, перлу пофигу какое у него расширение, он получает только хтмл код, то есть чтобы что-то исправить надо доступ к серваку
Товарищи, привет всем! Есть проблема. К примеру есть список адресов вида: http://www.example.org/1234/text/ http://www.example.org/1235/text/ http://www.example.org/1236/text/ http://www.example.org/1237/text/ нужно его пропарсить, и сохранить вывод каждой страницы в какую-нибудь папку, чтобы было в ней типа того: ./any_dir/1234.txt ./any_dir/1235.txt ./any_dir/1236.txt ./any_dir/1237.txt etc Т.е. есть проблема. Нужно сохранять выданые веб-сервером странички. Есть решение подобной проблемы?
#!/usr/bin/perl -w use LWP::UserAgent; $browser = LWP::UserAgent -> new; $url = ''; $str = 1; # с какой стр начинать $end = 20; # закончить while ($str<$end) { $request = $browser -> get ("$url".$str)->content; $dir = int(rand(1000)); mkdir ($dir); open (LOG , ">./$dir/$str.html"); print LOG $request; close LOG; $str++; }
Нужно обусифицировать perl код, есть ли обусификаторы уже готовые или может быть есть статьи на русском по этой теме?