Напиши 64-х битный сортировщик строк и убийцу дубликатов для больших словарей - такого софта нету! Чтоб юзал оперативку на полную и сортировал в памяти 4-6Гб. словари. P.S. Очень нужен такой софт - пойду консультантом, относительно "правильной" сортировки строк и бетта тестером.
мне нужна такая штука, как crontab, но чтоб там можно было выставить максимальное время выполнения задания. Костыли костылями, но фишка этого демона чтобы задания 100% не длилось больше заданного и при этом этот демон не должен жрать практически ничего, как и сам crontab P.S. Очень нужен такой софт - пойду консультантом и бетта тестером.
Не нужно GPU для алгоритма сортировки, просто в памяти надо индексы у элементов массива расставить и вывести в файл в нужном порядке, для GPU есть другие задачи однотипных параллельных вычислений (собственно перебор хэшей - брут).
Спамер какой либо. Пару лет назад это сделал, и по утрам не просыпаюсь. Это для начала. И предумай как использовать ресурсы сотен пк. Так что бы не нарушать закон и желательно, не тырить трафик.
а чем те что сейчас есть не устраивают ? насколько помню есть как минимум 2 подобных скрипта в паблике.
Я даю сто процентов что такой софт из-за его аудитории будет через пять минут крякнут и ТС не сделает и 10 продаж.
Напиши такой, покажи как он работает и создай сайт- с сервисов по словарям с закачкой словарей на серв обработкой выплатами кому нужно что нужно любые операции будеш в теме К примеру - тебе дают словать в 6 гб Дают тебе тз - что сделать с ним что отобрать что удалить что еще что то - Результат - цена оплата - получаеш готовый файл. профит Можно типа раздачу через обменники сделать или же торрен как то
Если речь идет о массах, то только игры. Игровая индустрия - это оборот с миллионами или адеж миллиардами долларов в год. На новые хорошие игры есть постоянный спрос. В остальном уже всего хватает. У большинства ща компы для игр фильмов и заКОНТАЧЕНЫХ ОДНОКЛАСНИКОВ с ютубом и цукерманом. Остальное по мелочам
Затестил софт - хрень полная - слова в кириллице все коверкает, любая русская буква заменяется на ?. Ну и киляет соответсвенно всё что не попадя. Из 180 Мб. уже без дубликатов вырезал мне еще 30Мб. P.S. Нахрена вообще такой софт писать? Лучшее из того что Я видел это разработка от ErorrNeo - Truesort но и там есть косяк, у меня на сервисе вывешен мегословарь собранный этим софтом размером в 2,69Гб (тут ). так вот он не проходит тест на сортировку ибо собран с ошибкой (не верно отсортирован) из-за этого я не могу его слить с другим отсортированным словарём, удалив при этом дубликаты. Code: E:\Работа со словарями\Sliyanie>cmd /k join.exe ------------------------------------------------------------------- Fist file -> file1.txt, size - 2890525729 bytes Second file -> file2.txt, size - 1728832577 bytes Start, wait please... Check sort file1.txt...75% it`s not sorting! [COLOR=Red]'vlik1975_0204'>'pavlik1976'[/COLOR] E:\Работа со словарями\Sliyanie> P.P.S. Кароче проблема есть реальная с большими словарями и реально её решить быстро можно написав 64-х битный сортировшик-убийцу дубликатов. Нашёл на том форуме Textpipe9.1Pro - мощный текстовый процессор, но запустил тривиальную задачу: сборка двух словарей в один с удалением дубликатов и сортировкой (размеры 45Мб. и 85Мб.) - софт работает уже 1 час! и показывает оставшееся время в 1,5 часа! Вот правильная сортировка строк в памяти (массива). PHP: <?PHP $n=0; $s= file_get_contents('pass.txt'); $result = explode("\r\n", $s); $result = array_unique ($result); sort($result,SORT_STRING); $ofile='out.txt'; $x = count($result); $d = fopen($ofile, 'w'); for($i=0;$i != $x;$i++) { fwrite($d, $result[$i]."\r\n"); if ($n==10000) { $m=$m+10000;$n=0; $pr=ceil($i*100/$x);$p=ceil($pr/4); $bar=substr('ІІІІІІІІІІІІІІІІІІІІІІІІІ', 1, $p).substr('°°°°°°°°°°°°°°°°°°°°°°°°°',1,25-$p); echo "Words:".($i)." Progress:".$bar." ".$pr."%\r"; } $n=$n+1; } $pr=ceil($i*100/$x); $bar=substr('ІІІІІІІІІІІІІІІІІІІІІІІІІ', 1, $p).substr('°°°°°°°°°°°°°°°°°°°°°°°°°',1,25-$p); echo "Words:".($i)." Progress:".$bar." ".$pr."%\r"; fclose($d); ?> но облом на размере выделенной памяти, 2-4Гб. уже так не отсортируешь!
sort(сортировка) + uniq(удалить повторы) + split(разделить если надо) + cat(склеить несколько) + etc?
Ага+ можно добавить различные входные и выходные фильтры (обрезать по длинне, отобрать по маске и т.д.) В идеале сделать главную функцию: Слияние всех словарей в папке в один, удаление дубликатов и упорядочивание сумарного файла. На выход добавить фильтры (обрезка по длине + по маске - маска должна задаваться пользователем из стандартных наборов хотя-бы, если сделать ещё и поддержку пользовательских это вообще круто будет.) правда в этом случае после применения фильтров придётся снова упорядочить и отсортировать перед записью. Есть ещё одна тонкость: необходим входной фильтр - убивание слов с не принтабельными символами (не обязательно всех!) но некоторые PasswordsPro принимает за конец файла и останавливает проход по словарю (вот такие надо фильтровать).
я написал умена утилит в *nix и что они делают. вот так в линухе можно сделать твою главную функцию cat * > all.txt я это к чему, можно сделать очень простой bash скрипт который будет использовать стандартные системные утилиты и делать весь по твоему мнению сложный функционал.
1. MySQL-сервер с БД с одной таблицей 2. скрипт последовательного/паралельного загона файла в БД 3. один SQL-запрос на вывод таблицы в сортированном варианте