нужно вытащить текст с сайта

Worms · 15 Oct 2010

на сайте есть определенная рубрика с объявлениями,как можно вытащить именно объявления в текстовый документ? чем можно?

aydar · 15 Oct 2010

pos,delete,copy думаю хватит

090808 · 15 Oct 2010

function Pars(T_, ForS, _T: string): string;
var
a, b: integer;
begin
Result := '';
if (T_ = '') or (ForS = '') or (_T = '') then
Exit;
a := Pos(T_, ForS);
if a = 0 then
Exit
else
a := a + Length(T_);
ForS := Copy(ForS, a, Length(ForS) - a + 1);
b := Pos(_T, ForS);
if b > 0 then
Result := Copy(ForS, 1, b - 1);
end;

Ну а дальше что нужно парсить так.

s:=pars('C какого текста парсим',с какой переменной парсим,'До какого текста парсим');

6anzay · 15 Oct 2010

Worms said:

на сайте есть определенная рубрика с объявлениями,как можно вытащить именно объявления в текстовый документ? чем можно?
Click to expand...

я Через yahoo pipes делал типа парсилки что-то.
Очень прикольный сервис

Worms · 15 Oct 2010

090808 said:

function Pars(T_, ForS, _T: string): string;
var
a, b: integer;
begin
Result := '';
if (T_ = '') or (ForS = '') or (_T = '') then
Exit;
a := Pos(T_, ForS);
if a = 0 then
Exit
else
a := a + Length(T_);
ForS := Copy(ForS, a, Length(ForS) - a + 1);
b := Pos(_T, ForS);
if b > 0 then
Result := Copy(ForS, 1, b - 1);
end;

Ну а дальше что нужно парсить так.

s:=pars('C какого текста парсим',с какой переменной парсим,'До какого текста парсим');
Click to expand...

а вот тут чуть поподробнее можно?а то я не особо разбераюсь в програмировании. это все куда воткнуть надо?

xhugo · 15 Oct 2010

Worms, можно проще..

Зайди на свой сайт, глянь исходный код страницы, смотри под какими тегами объявления..

например
кинь на форму memo, idhttp,button.

и при нажатие кнопки пиши:

var
s:string;
begin
s:=idhttp1.get('http://site.ru'); ..сайт
memo1.lines.add(Copy(s, pos('<title>', s) + 7, pos('</title>', s) - pos('<title>', s) -7)); ..выдераем

Worms · 15 Oct 2010

а если на сайте некоторый текс такой как номер телефона находится в картинке... есть такой вариант?

Worms · 15 Oct 2010

это вообще на каком языке все чтот вы мне рассказали? а то я читаю и аж приятно тчо есть что-то,а понять ниче не могу

Artist · 15 Oct 2010

Worms said:

это вообще на каком языке все чтот вы мне рассказали? а то я читаю и аж приятно тчо есть что-то,а понять ниче не могу
Click to expand...

Это Delphi, а какой тебе надо?

Worms · 15 Oct 2010

ща буду вникать! я вообще никакого незнаю

Worms · 15 Oct 2010

исходя из этого что куда надо вставлять?
<a href="/realty/sell/residential/secondary/detail/8817.php" target="_blank" onclick="window.open('/realty/sell/residential/secondary/detail/8817.php','details8817','location=1,status=1,scrollbars=1,width=850,height=800'); return false;">
<b>Серова ул, д. 480</b>
</a>
<div class="rl_note">Ленинский р-н</div>
<div align="right"><a href="javascript;" target="_blank" class="rl_underline_dashed_2" onclick="realty.showDetails(8817, '/realty/sell/residential/secondary/1.php'); if ( this.innerHTML == 'краткий просмотр' ) { this.innerHTML = 'закрыть просмотр' } else { this.innerHTML = 'краткий просмотр' }; return false;">краткий просмотр</a></div>
</td>
<td align="center" class="black">
самого то текста все-равно нет если смотреть исходный код страницы, там идет текст и на этом тексте как бы ссылка на полное объявление, как так тут быть?

Worms · 15 Oct 2010

"краткий просмотр" там продолжение текста,куда оно уходит и как словить это все и сделать чтобы в текстовике можно было сохранить чтобы шел текст объявления на каждой строчке без лишнего мусора

Artist · 15 Oct 2010

Надо полный просмотр текста, чтоб его вытащить. Скинь ссылку на сайт, где надо вытащить текст.

Worms · 15 Oct 2010

вот
http://www.vdv-kavkaz.ru/index.php?option=com_adsmanager&page=show_category&catid=105&order=0&expand=0&Itemid=131
нужно вытащить всю рубрику объявлений и обрати особое внимание на номера телефонов, они защищены как раз от этих нужд и переведены в png формат

090808 · 15 Oct 2010

с картинки ты врятли вытащишь текст, только если писать свой распознователь...

Worms · 15 Oct 2010

а вот отсюда? http://26.ru/realty/sell/residential/secondary/1.php
тут нет такой защиты но есть как бы отдельно выведено текст объявления при нажатии на кнопку краткий просмотр.

а вделфи я чет так и не понял куда засунуть это все надо было?

090808 · 15 Oct 2010

Учи азы дельф.
Потому что незная ничего ты и не сделаешь ничего

shadowrun · 15 Oct 2010

Worms, готов помочь за символическую сумму...
ася: 615881591

Worms · 15 Oct 2010

я как то давно учил.... калькулятор даже сделал
хорошо у меня есть парсер на perlе он работает как надо и все ъамечательно! но у меня есть сохраненные страницы этого же сайта с которго он вытаскивал инфу,как мне сделать так чтобы он с жесткого диска схавал сораненные страницы?? денвер ставил,не помогло. вот код парсера может кто поймет че можно поменять в нем? и по этому принципу можно его подправить на сайт другой?

#!/usr/bin/perl

use LWP::UserAgent;
use HTTP::Cookies;
use HTML::Entities;

$ua = LWP::UserAgent->new;
$ua->agent("Opera/9.25 (Windows NT 5.1; U; ru)");

$cookie_jar = HTTP::Cookies->new();
$ua->cookie_jar($cookie_jar);

sub logg

{
my ($data, $file) = @_;
open(OUT, ">> ".$file);
print OUT "$data\n";
close(OUT);
}

for ($i = 0; $i < 165; $i++)

{
my $ex = $ua->get('http://realty.1777.ru/search_real_poisk.php?ch=&ord=&poisk=&poisk2=&tabs=0&poisk5=&poisk3=&real_raz_id=&real_cat_id=35&ot=0&do=1000000000&sort=&mix=&pajina='.$i)->content();

my @infos = $ex =~ /<td width=80% valign=top colspan=2><span class=header_red>(.+?)<noindex>/gs;

foreach $info (@infos)
{
$info =~ s/ / /g; decode_entities($info); $info =~ s/<.+?>/ /g; $info =~ s/\s+/ /g; $info =~ s/^(.+?)\s//g;

logg($info."\n\n", 'data.txt');
}

print('page '.$i."\n");
}

system("pause");

Nelz. · 15 Oct 2010

Worms said:

вы че обиделись?
Click to expand...

да,такое дело в другом разделе _https://forum.antichat.ru/forum57.html

нужно вытащить текст с сайта

Worms Elder - Старейшина

aydar Member

090808 Member

6anzay Member

Worms Elder - Старейшина

xhugo New Member

Worms Elder - Старейшина

Worms Elder - Старейшина

Artist Member

Worms Elder - Старейшина

Worms Elder - Старейшина

Worms Elder - Старейшина

Artist Member

Worms Elder - Старейшина

090808 Member

Worms Elder - Старейшина

090808 Member

shadowrun Banned

Worms Elder - Старейшина

Nelz. Member

Useful Searches

нужно вытащить текст с сайта

Worms Elder - Старейшина

aydar Member

090808 Member

6anzay Member

Worms Elder - Старейшина

xhugo New Member

Worms Elder - Старейшина

Worms Elder - Старейшина

Artist Member

Worms Elder - Старейшина

Worms Elder - Старейшина

Worms Elder - Старейшина

Artist Member

Worms Elder - Старейшина

090808 Member

Worms Elder - Старейшина

090808 Member

shadowrun Banned

Worms Elder - Старейшина

Nelz. Member