Озадачился я тут значит чутка попарсить сайтец с недвижимостью вот энтот arenda.mirkvartir.ru До этого парсеры не писал, потому гугл в помосчь) В итоге все встало в самом начале PHP: $content = file_get_contents("http://arenda.mirkvartir.ru/119569346/"); echo "<pre>"; echo $content; echo "</pre>"; Сей код выдает жуткую хрень. Понимаю что трабла с кодировкой. Танцы с бубном в направлениях: PHP: iconv(), mb_convert_encoding(), .htaccess AddDefaultCharset header('Content-type: text/html; charset=utf-8'); к успеху не привели =( Кто что может подсказать? В пхп вечно заплеты с кодировками =(( Заранее спасибо ЗЫ: Сам скрипт в UTF-8 и сайт, который парсим, тож вроде в ней, а хрень какаято получаецца
PHP: <? function gzDecode($d) { $f = ord(substr($d, 3, 1)); $h = 10; $e = 0; if($f&4) { $e = unpack('v', substr($d, 10, 2)); $e = $e[1]; $h += 2 + $e; } if($f&8) { // ERROR HERE $h = @strpos($d, chr(0), $h) + 1; } if($f&16) { $h = strpos($d, chr(0), $h) + 1; } if($f&2) { $h += 2; } // ERROR HERE $u = @gzinflate(substr($d, $h)); if($u == false) { $u = $d; } return $u; } $content = file_get_contents("http://arenda.mirkvartir.ru/119569346/"); echo "<pre>"; echo gzDecode($content); echo "</pre>"; файл надо сохранить в utf-8 + bom
спасибо всем, способ от Dark_cracker помог, действительно, выяснилось, что страница приходила сжатой в gzip правда сам уже разобрался к тому моменту, но все равно, спс, кому-то еще может пригодиться))