Из файла извлечь RU слова

Hapk · 4 Sep 2012

Как из текстового документа извлечь только русские слова?

в текстовике записано вот так

вася
vasay
петя
маша
паша
masha
света
peta

нужно отделить только русские слова

sn0w · 4 Sep 2012

bool is_russian_ansi(char *str)
{
bool rc = true;

strupr(str);

while(*str)
{
if(*str < 'А' || *str > 'Я')
{
rc = false;
break;
}
str++;
}

return rc;
}

логика думаю ясна.

drim · 4 Sep 2012

Code:
cat list.txt | perl -ne 'print if /[А-я]+/'
только локаль в перле прописать русскую (лень искать)

Hapk · 4 Sep 2012

А что это за код? я же не шарю что с этим делать

drim · 4 Sep 2012

командная строка bash.
когда нужно что-то распарсить, заливаю файл на любой *nix-сервак и препарирую его инструментами bash/perl/sed/awk. получается быстро и эффективно.
В более запущенных случаях (когда файл большой), использую импорт в sqlite и манипулирую на SQL-языке
чего и всем рекомендую.

Skofield · 4 Sep 2012

1-е действие:
notepad++ -> Ctrl+h:
Найти: [A-Za-z].*
Заменить на: (пробел)
....
Режим поиска - Регулярное выражение
----------------------------------------------------
2-е действие:
notepad++ -> Ctrl+h:
Найти: (пробел)\r\n
Заменить на: (нулевая строка)
....
Режим поиска - Расширенный

fl00der · 4 Sep 2012

В RegExFilter от allknower есть готовый фильтр для убийства строк, содержащих что-либо, кроме русских слов.

Hapk · 4 Sep 2012

Всё спасибо ребятишки
я разобрался))

Из файла извлечь RU слова

Hapk Banned

sn0w Статус пользователя:

drim Member

Hapk Banned

drim Member

Skofield Elder - Старейшина

fl00der Moderator

Hapk Banned

Useful Searches