[Perl] Новичкам: задаем вопросы

DDoSька · 3 Mar 2009

demond said:

Самый лучший язык программирования PERL!!!!!!!!!!!!!
Ссылок на книжки про PHP не даем!
Click to expand...

По губам бы тебе лопатой

DDoSька · 3 Mar 2009

Ребята, приведите пожалуйста пример простого парсера,который выдирает все из <title>(.*)</title>.
ЗЫ: С пыхой дружу, но решил переходить на многопоточность
Заранее благодарен

demond · 3 Mar 2009

DDoSька said:

Ребята, приведите пожалуйста пример простого парсера,который выдирает все из <title>(.*)</title>.
ЗЫ: С пыхой дружу, но решил переходить на многопоточность
Заранее благодарен
Click to expand...
Code:
#!/usr/bin/perl -w
use locale;
$text = "<html>asda dddddasd<title>9asdfasd asdf asd asdf asdff asdfff 111</title>sadf</html>";
$text=~m/<title>(.*)<\/title>/ig;
print $1;
В переменной $1 будет все что тебя интересует.
Чтобы не было проблем с русским языком имеет смысл включить locale

DDoSька · 3 Mar 2009

Я знаю как это на php сделать:

PHP:

$text=file_get_contents('http://google.com'); preg_match('#<title>(.*)</title>#',$text,$out); echo $out[1];

Вот мне нужно тоже самое,только на PERL
То есть обязательно грабить с сайта
Я в перле не бум-бум ,извините.
Спасибо заранее

demond · 3 Mar 2009

budden, прикрепи к своему сообщению готовый файл для парсинга, чтобы мне его самому не писать. Или лучше в личку. Тебе рабочий код нужен или идея?

demond · 3 Mar 2009

DDoSька said:

Я знаю как это на php сделать:

PHP:

$text=file_get_contents('http://google.com'); preg_match('#<title>(.*)</title>#',$text,$out); echo $out[1];

Вот мне нужно тоже самое,только на PERL
То есть обязательно грабить с сайта
Я в перле не бум-бум ,извините.
Спасибо заранее
Click to expand...
Code:
#!/usr/bin/perl
use LWP::Simple;
$content = get("http://www.mail.ru/");
die "Couldn't get it!" unless defined $content;
$content =~ m/<title>(.*?)<\/title>/img;
print $1;
Пользуйся на здоровье!
Магазин ВМ

GAVVVR · 6 Mar 2009

GAVVVR said:

Написал вроде скрипт как скрипт, а выдает при запуске:

При этом пропускает какие либо действия связанные с LWP.
Click to expand...

Разобрался. . У меня было примерно так:

#! /usr/bin/perl -w
use LWP::UserAgent;
use HTTP::Cookies;
$ua = LWP::UserAgent->new(
agent => 'Opera/9.27 (Windows NT 5.1; U; ru)',
);
$ua->cookie_jar
( HTTP::Cookies->new(
'file' => 'C:/test/cookies.lwp',
'autosave' => 1,
)
);
$res = $ua->get ("localhost")->as_string;
#И так дале...
Click to expand...

Почему то жестко ступил и во всем скрипте вместо http://localhost/ написал localhost

S0ulVortex · 10 Mar 2009

Вобщем нужна помощь с учебником по perl скачал учебник называется "perel за 24 часа"
Ну почему я выбрал именно этот и так понятно, но как оказалось не все так просто прочитал пол учебника а толку реально 0 сам мало чего могу написать максимум это представление что такое perl. Посоветуйте учебник для новичка чтобы понятно было а не как там.

demond · 10 Mar 2009

начинал с документации на citforum. А вообще много книжек у O'reilly, в том числе и для начинающих!

TheSoul · 10 Mar 2009

"Perl. Специальный справочник"
почитай эту ...

GAVVVR · 10 Mar 2009

S0ulVortex, понравилась эта книга. Написана вроде толково. Правда, я ее еще до конца не прочел))

S0ulVortex · 10 Mar 2009

Да я уже скачал книгу "Perl. Специальный справочник" уже первые 2 части разобрал вроде более мение понятно но все же не все. Но думаю понимание будет когда прочитаю весь учебник.

Pridu_ROCK · 11 Mar 2009

Понимание придет только после того как начнешь програмить =)) Чтение эт конечно хорошо, но мое предпочтение будет намного больше к практику нежели к теоретику =)) Я думаю так и у всех =)

ph1l1ster · 11 Mar 2009

как заставить перл воспринять расширение .php.xl Чтобы он открывал его через LWP::UserAgent как обычное .php ??

roddik · 11 Mar 2009

ph1l1ster, если ты открываешь через LWP::UserAgent файл на другом серваке, перлу пофигу какое у него расширение, он получает только хтмл код, то есть чтобы что-то исправить надо доступ к серваку

real_kas · 11 Mar 2009

Товарищи, привет всем!

Есть проблема. К примеру есть список адресов вида:

http://www.example.org/1234/text/
http://www.example.org/1235/text/
http://www.example.org/1236/text/
http://www.example.org/1237/text/

нужно его пропарсить, и сохранить вывод каждой страницы в какую-нибудь папку, чтобы было в ней типа того:

./any_dir/1234.txt
./any_dir/1235.txt
./any_dir/1236.txt
./any_dir/1237.txt

etc

Т.е. есть проблема. Нужно сохранять выданые веб-сервером странички. Есть решение подобной проблемы?

TheSoul · 11 Mar 2009

#!/usr/bin/perl -w

use LWP::UserAgent;

$browser = LWP::UserAgent -> new;
$url = '';
$str = 1; # с какой стр начинать
$end = 20; # закончить
while ($str<$end) {
$request = $browser -> get ("$url".$str)->content;
$dir = int(rand(1000));
mkdir ($dir);
open (LOG , ">./$dir/$str.html");
print LOG $request;
close LOG;
$str++;
}

Chaak · 11 Mar 2009

Что делает эта регулярка?

s/(\$\w+)/$1/eeg
Click to expand...

Pashkela · 11 Mar 2009

http://books.onlinekniga.ru/books/coockbook/01/8

$p01nt · 11 Mar 2009

Нужно обусифицировать perl код, есть ли обусификаторы уже готовые или может быть есть статьи на русском по этой теме?

[Perl] Новичкам: задаем вопросы

DDoSька Elder - Старейшина

DDoSька Elder - Старейшина

demond Member

DDoSька Elder - Старейшина

demond Member

demond Member

GAVVVR Elder - Старейшина

S0ulVortex Elder - Старейшина

demond Member

TheSoul Elder - Старейшина

GAVVVR Elder - Старейшина

S0ulVortex Elder - Старейшина

Pridu_ROCK Member

ph1l1ster Elder - Старейшина

roddik Member

real_kas Member

TheSoul Elder - Старейшина

Chaak Elder - Старейшина

Pashkela Динозавр

$p01nt Elder - Старейшина

Useful Searches

[Perl] Новичкам: задаем вопросы

DDoSька Elder - Старейшина

DDoSька Elder - Старейшина

demond Member

DDoSька Elder - Старейшина

demond Member

demond Member

GAVVVR Elder - Старейшина

S0ulVortex Elder - Старейшина

demond Member

TheSoul Elder - Старейшина

GAVVVR Elder - Старейшина

S0ulVortex Elder - Старейшина

Pridu_ROCK Member

ph1l1ster Elder - Старейшина

roddik Member

real_kas Member

TheSoul Elder - Старейшина

Chaak Elder - Старейшина

Pashkela Динозавр

$p01nt Elder - Старейшина