Перевыложил http://95.78.127.11/Shared/wordlist/ https://drive.google.com/folderview?id=0B2PDYKRPDYZiVVNBWUQzY1JOM2c&usp=sharing
парни, а чем порезать словарь на куски по размеру? у меня примерно гигабайт в час проверяет, было бы хорошо большие словари разразать гигов на 10, чтоб в случае сбоя не начинать все заново.
вот написал на коленке, может кому пригодится. Читает и записывает пока не упрется в максимальный размер словаря, тестил 5,6гб полет норм. Code: <?php error_reporting(E_ALL); ini_set('memory_limit','2048M'); set_time_limit(0); function formatsize($s = 0) { if ($s >= 1073741824) return sprintf('%.2f', $s / 1073741824).' GiB'; else if ($s >= 1048576) return sprintf('%.2f', $s / 1048576).' MiB'; else if ($s >= 1024) return sprintf('%.2f', $s / 1024).' KiB'; else return $s.' bytes'; } function write() { $file = dirname($GLOBALS['dic']).'/'.basename($GLOBALS['dic']).$GLOBALS['i']; $GLOBALS['writeCount'] += strlen($GLOBALS['data']); echo 'Writing: '.basename($file).' - '.formatsize($GLOBALS['writeCount']).chr(10); $fp = fopen($file,'a'); fwrite($fp,$GLOBALS['data']); fclose($fp); unset($GLOBALS['data']); $GLOBALS['data'] = ''; if ($GLOBALS['writeCount']>=$GLOBALS['splitSize']) { $GLOBALS['writeCount'] = 0; ++$GLOBALS['i']; } } $dic = './split/test.txt'; // Словарь $buffSize = 1024*1024*150; // Сколько читать в буфер $splitSize = 1024*1024*1024; // Максимальный вес словаря $i = $writeCount = 0; $data = $end = ''; $fp = fopen($dic,'r'); while(!feof($fp)) { $data .= fread($fp,$buffSize); echo 'Read: '.formatsize(strlen($data)).chr(10); if (substr($data,-1) <> "\n") { do { $end = fgetc($fp); if ($end !== false) $data .= $end; if ($end == "\n" || $end === false) { write(); $end = ''; break; } } while ($end <> "\n"); } else write(); } fclose($fp); echo 'Done!'; ?> или Code: split -C размер_в_байтах словарь
Круто, но зачем? Вот народ с завидным постоянством тут ищет какие-то утилиты для работы с текстом...Ребята, все для обработки текста уже давно написано, причем большая часть в те времена, когда персональных компутеров еще не было И данный момент этот код давно вылизан и доведен до совершенства. Т.е. это самое быстрое, что может быть. Данную задачу, т.е. разрезать словарик любого размера на куски, выполняет утилита split. Лучше использовать виртуальную машину, потому что там еще много полезных утилит есть, но , есть и порт split под вин.
да понятно, что все придумано до нас, но степень красноглазия у всех разная) если что будет работать под виндоуз - ок, емедитор отказался открывать полностью словарь стогиговый, говорит, что много.
Все нормально открывается, нажимайте "открыть середину" или "открыть конец" и выбирайте нужный диапазон строк. Просто там строки нумеруются в integer, соответственно нельзя разом открыть более 2^32 строк (4294967296)
господи да возьми тот же splitter от winmend и режь на скока хош и ничего открывать не надо, а то эти умники начали тут вату катать вместо того чтобы ответить одним словом
.....что кто-то ленится дочитывать man до конца Code: -C, --line-bytes=SIZE put at most SIZE bytes of lines per output file
Итак, большая подборка словарей мобильных телефонов с разбивкой по диапазонам каждого региона/республики. Формат телефонов: 1234567890 +71234567890 71234567890 81234567890 В среднем 250мб на регион (Москва 6гб). Полный список: http://pastebin.com/cTNbKuKq Скачать: http://yadi.sk/d/sW-m5X7vCmwkd Диапазоны с сайта: http://www.number-ok.ru/region.php
http://rusfolder.com/38823012 извините если баян 1. идете на http://allnum.ru/operator/ 2. Выбираете кликаете оператора 3. Сверху Фильтруете по региону 4. получаете префиксы коды типа 9273 5. забиваете в dgen "9273 93312" 6. получаете словарь номеров вашего региона
еще немного усовершил http://rusfolder.com/38823143 можно написать "91830" и программа добавит варианты до 10цифр, а можно теперь и диапазон "9183000000-9183099999" Кавычки обязательны, пробелы - разделители,типа "9183000000-9183099999 9189300000-9189999999 92844" тут 2 диапазона, и 1 номер для вариации из 5 последних цифр
http://95.78.127.11/Shared/wordlist/phoneRUS.7z все сотовые номера всех операторов всех регионов России
вы хоть пишите с каким префиксом сотовые. а то может быть 4 разных варианта! кто-то без 8ки поставит, кто-то с 7кой.... а кто и + нарисовать может. например: 918 7 918 +7 918 8 918