Инструмент на основе искусственного интеллекта может с беспрецедентной точностью обнаруживать «вредную» информацию в сети Два года назад компания Google представила новый поисковый алгоритм BERT для лучшей обработки запросов на разных языках. С помощью нейронной сети алгоритм анализирует не отдельные слова, а предложения целиком, что существенно улучшает релевантность выдачи. Оказалось, что на базе BERT можно создать крайне эффективного ИИ-цензора, чем воспользовались китайские разработчики. Он позволяет находить подлежащие цензуре тексты с точностью в 91%, утверждают исследователи. При этом, например, поиск по ключевым словам даёт точность в 70%, а у обученной людьми нейросети — 80%. Алгоритм Google BERT с открытым кодом не может анализировать тексты длиной более 512 слов. Чтобы обойти это ограничение разработчики из Шэньянского университета Лигун и Китайской академии наук разработали алгоритм для разбивки больших текстов на доступные для анализа с помощью BERT и технологию последующей сборки текстов до первоначального объёма. Получилось решение, которое может искать даже скрытый между строк подтекст. Интернет в Китае находится под строгим контролем правительства. Здесь заблокированы сайты Google, Facebook, Twitter, иностранных новостных агентств, а на тех сайтах, которые разрешены, большой процент информации цензурируется. Среди запрещённых в китайском интернет-пространстве тем — порнография, злоупотребление наркотиками, оружие и терроризм. Также нельзя критиковать компартию и её верхушку. https://www.securitylab.ru/news/518922.php
мда...вот вам наглядно насколько отличаются уровни умений белого человека и китайских академиков )))))))) гугл написал ахуенно интеллектуальный опен-сорс алгоритм, гуки научились разбивать тест на куски по 512 слов и использовать его для слежки за своими собратьями ))))))
Самый лучший цензор на Мордокниге. Там если назвать оленя - оленем, а петушка - петушком (причем исключительно в рамках цензурных слов из толкового словаря русского языка) то можно поймать RO на неделю, а то и на месяц.