Парсинг.. Доброго времени суток помогите с парсом страницы: То что нужно спарсить выделенно Code: <div class="si_map_header" id="HTML_curr_map"> [COLOR=Magenta]de_train[/COLOR] </div> Code: <div class="si_map_image" id="HTML_map_ss_img"> <img src="[COLOR=Magenta]http://image.www.gametracker.com/images/maps/160x120/cs/de_train.jpg[/COLOR]" alt="" class="item_160x120" /> Code: <span id="HTML_num_players">[COLOR=Magenta]0[/COLOR]</span> / <span id="HTML_max_players">[COLOR=Magenta]21[/COLOR]</span> _________________________________________________ Буду благодарен за помощь
20ldbi4 1. /<div.+>\s+(.+)\s+<\/div>/ 2. /<img src=\"(.+?)\".+>/ 3. /<span id=\"HTML_num_players\">(.+?).+<span id=\"HTML_max_players\">(.+)<\/span>/
хм.. все равно что то не так <div>Общий заработок: <span>$5.03</span></div> Code: $resp =~ /<div>Общий заработок: <span>\$(\d+\.)(\d+)<\/span><\/div>/smi; my ($money) = $1 . $2; usr of ininitialized velue $1 и $2
Code: my $str = '<div>Общий заработок: <span>$5.03</span></div>'; $str =~ /<span>(\$\d+\.\d+)<\/span>/; print $1;
Символы < и > тоже надо экранировать... Code: my $str = '<div>Общий заработок: <span>$5.03</span></div>'; $str =~ /\<div\>Общий заработок: \<span\>\$(.+?)\<\/span\>\<\/div\>/; print $1."\n";
всеравно ошибка usr of ininitialized velue $1 к чему ето строка не понятно Code: my $str = '<div>Общий заработок: <span>$5.03</span></div>'; етоя привет кусок кода страници который нужно спарсить PHP: <div>Общий заработок: <span>$5.03</span></div>
Тебе не надо её писать.. она для примера.. Code: $str = 'код страницы с которой парсишь данные'; $str =~ /\<div\>Общий заработок: \<span\>\$(.+?)\<\/span\>\<\/div\>/g; print $1."\n";
Сколько можно? Когда угловые скобки в регулярках экранироваться стали внезапно? Используй мой вариант (выше), он работает. Доказательство: http://codepad.org/irQ7CyTx
у меня в коде не работает твой способ я уже проверял 100 раз usr of ininitialized value $1 in concatenation (.) or string
Упс... Всю сознательную жизнь их экранировал, сейчас глянул и правда без экранирования работает... О_0 В общем я в шоке... ЗЫ: кстати мой вариант тоже работает (даже без экранирования угловых), так что скорее вснго трабл где-то у ТС-а... mazaxaka, ты уверен, что в переменной $str у тебя то, что нужно...
$resp = $ua->get("http://bonus.depositfiles.com/ru/gold/bonus_program.php")->as_string; wf($file, $resp); $resp =~ /<a class="button_add" >Выплатить<\/a>.*?<span>.(\d+\.\d+)<\/span>/smi; my $money = $1 . $2; print $money ; специально сохраняю чтобы посомтреть.. страница полность получина. все имеется . но регулярка не вырезает значение. немного передлал . на сайте проверил работает. а у меня нет
mazaxaka, там кодировка utf-8, думаю из-за этого не пашет.. переведи "Общий заработок" из windows-1251 в utf-8, а потом подставляй в регулярку...
Как из ссылки вида site.ru/index.php?inc=view&id=777 site.ru/inc/view/id/777 или site.ru/view/777 или ну его нах этот чпу
есть: index.php?mode=blabla1&act=blabla2 index.php?mode=blabla3&act=blabla2 нужно чтобы было site.com/blabla1 site.com/blabla3