Имеется файл, вот такого содержания: PHP: <tr class='r0'><td class=k>102</td><td class=c><a title='Делегирован'><img src='/images/state_d.gif' alt='Делегирован'></a></td><td class=l><a href='/?domain=bonuswm.ru'>bonuswm.ru</a></td><td class=l><a href='/?show=whois&person=Private person'>Private person</a></td><td class=c><a href='/?ns=ns0.s0t.ru. ns1.s0t.ru.'>ns0.s0t.ru.<br>ns1.s0t.ru.</a></td><td class=c><nobr> <a href='/?show=whois&phone=%2B7 9500036527%'>+7 9500036527 <br>+7 8124270200</a></nobr></td><td class=c><noindex><img src='/email.php?e=ZG5zQHMwdC5ydQ=='></noindex><br><noindex><img src='/email.php?e=c290c29mdEBnbWFpbC5jb20='></noindex></td><td class=c>REGTIME-REG-RIPN</td><td class=c><nobr>12-01-2007</nobr></td><td class=c><nobr>12-01-2012</nobr></td></tr> <tr class='r1'><td class=k>103</td><td class=c><a title='Делегирован'><img src='/images/state_d.gif' alt='Делегирован'></a></td><td class=l><a href='/?domain=bonuswmr.ru'>bonuswmr.ru</a></td><td class=l><a href='/?show=whois&person=Private Person'>Private Person</a></td><td class=c><a href='/?ns=reg.ru'>reg.ru</a></td><td class=c><nobr> <a href='/?show=whois&phone=%2B79278820270%'>+79278820270</a></nobr></td><td class=c><noindex><img src='/email.php?e=YWRteG9zdEBnbWFpbC5jb20='></noindex></td><td class=c>REGRU-REG-RIPN</td><td class=c><nobr>15-01-2009</nobr></td><td class=c><nobr>15-01-2012</nobr></td></tr> В нем есть вот такие строки: PHP: /email.php?e=ZG5zQHMwdC5ydQ== /email.php?e=YWRteG9zdEBnbWFpbC5jb20= Как мы видим это email адреса закодированные в base64. Подскажите скрипт или программу, которая поможет сграбить эти строки и на лету их декодировать, чтобы на выходе получился вот такой список: Code: [email protected] [email protected]
Code: #!/usr/bin/perl use MIME::Base64; my $data = " <tr class='r0'><td class=k>102</td><td class=c><a title='Делегирован'> <img src='/images/state_d.gif' alt='Делегирован'></a></td><td class=l> <a href='/?domain=bonuswm.ru'>bonuswm.ru</a></td><td class=l> <a href='/?show=whois&person=Private person'>Private person</a> </td><td class=c><a href='/?ns=ns0.s0t.ru. ns1.s0t.ru.'>ns0.s0t.ru.<br>ns1.s0t.ru.</a> </td><td class=c><nobr> <a href='/?show=whois&phone=%2B7 9500036527%'>+7 9500036527 <br>+7 8124270200</a> </nobr></td><td class=c><noindex> <img src='/email.php?e=ZG5zQHMwdC5ydQ=='> </noindex><br><noindex><img src='/email.php?e=c290c29mdEBnbWFpbC5jb20='> </noindex></td><td class=c>REGTIME-REG-RIPN</td><td class=c><nobr>12-01-2007</nobr> </td><td class=c><nobr>12-01-2012</nobr></td> </tr> <tr class='r1'> <td class=k>103</td><td class=c><a title='Делегирован'> <img src='/images/state_d.gif' alt='Делегирован'></a> </td><td class=l><a href='/?domain=bonuswmr.ru'>bonuswmr.ru</a> </td><td class=l><a href='/?show=whois&person=Private Person'>Private Person</a> </td><td class=c><a href='/?ns=reg.ru'>reg.ru</a></td><td class=c><nobr> <a href='/?show=whois&phone=%2B79278820270%'>+79278820270</a></nobr></td> <td class=c><noindex><img src='/email.php?e=YWRteG9zdEBnbWFpbC5jb20='> </noindex></td><td class=c>REGRU-REG-RIPN</td><td class=c><nobr>15-01-2009</nobr> </td><td class=c><nobr>15-01-2012</nobr></td></tr> "; my @emeils = $data =~/email\.php\?e=(.+?)'/g; open(OUT, '> out.txt'); foreach $encoded (@emeils) { $decoded = decode_base64($encoded); print OUT "$decoded\n"; } close(OUT);
тут ты можешь раскодировать base64 http://www.kruglov.ru/useful/base64/ а где можна наити закадированиые mail в басе 64? (сорри за руски! узаю Транслит! )
В данном случае нужно использовать регулярные выражения,для парсинга Мыл.В VB.NET Это будет выглядеть примерно так: Code: Dim rssourcecode As String = sr.ReadToEnd Dim r As New System.Text.RegularExpressions.Regex("<img src=""/email.php?e"".*" = "") Dim matches As MatchCollection = r.Matches(rssourcecode) For Each itemcode As Match In matches ListBox1.Items.Add(itemcode.Value.Split("""").GetValue(0)) Next