Парсер фейка..

Discussion in 'Социальные сети' started by neofoks, 18 Feb 2009.

  1. neofoks

    neofoks Elder - Старейшина

    Joined:
    16 Apr 2008
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    Кто как чистит фейки от одинаковых/бредовых строк?

    P.S. Не подходит вариант руками.
     
  2. login999

    login999 Elder - Старейшина

    Joined:
    12 Jun 2008
    Messages:
    491
    Likes Received:
    280
    Reputations:
    92
    Пиши парсер, либо если хочешь, то я напишу на Python за пиво :)
     
  3. satana8920

    satana8920 Палач Античата

    Joined:
    22 Sep 2006
    Messages:
    396
    Likes Received:
    138
    Reputations:
    6
    dupkill + Notepad + ручки :)
     
  4. eXmasteR

    eXmasteR Member

    Joined:
    5 Dec 2008
    Messages:
    0
    Likes Received:
    5
    Reputations:
    0
    Это для удаления бредовых строк:
    PHP:
    <?php
    $input
    ="vkfile.txt";   //входной файл
    $output="vkfile-pars.txt";    //выходной файл
    $out=fopen($output,"w+");
    $f=fopen($input,"r");
     while (!
    feof($f))
     {
      
    $st=fgets($f,256);
      if((
    strpos($st"@")>0)&&(strpos($st":")!=(strlen($st)-3))) fputs($out,$st);
     }
     
    fclose($out);
     
    fclose($f);
     echo 
    "Программа успешно завершила работу.Счастливого нового года!";
    ?>
     
    а для удаления повторов советую http://www.softforfree.com/programs/text_duplicate_killer-11932.html
     
  5. neofoks

    neofoks Elder - Старейшина

    Joined:
    16 Apr 2008
    Messages:
    0
    Likes Received:
    0
    Reputations:
    0
    eXmasteR, Спасибо!
     
  6. >.:!FrE!:.<

    >.:!FrE!:.< Elder - Старейшина

    Joined:
    19 Jul 2008
    Messages:
    0
    Likes Received:
    28
    Reputations:
    0
    Два в одном :D

    PHP:
    <table>  
    <tr>  
    <td valign=top><form method="post">  
    <TEXTAREA NAME=mails ROWS=30 COLS=50></TEXTAREA>  
    <br/><input type="submit">  
    </form>  
    <td nowarp>  
    <?  
    if (isset($_POST['mails']))  
    {  
        $mails=strtolower($_POST['mails']);  
        preg_match_all('~[a-zA-Z0-9\.\_\-]+@[a-zA-Z0-9\_\-]+\.[a-zA-Z]{2,5}:(.*)~i',$mails,$result); 
        echo join('<br/>',array_unique(  
    array_map('htmlspecialchars',$result[0])));  
    }  
    ?>  
    </table> 
     
Loading...