Техника незаметного искажения фотографий для нарушения работы систем распознавания лиц

Suicide · 23 Jul 2020

Исследователи из лаборатории SAND при Чикагском университете разработали инструментарий Fawkes с реализацией метода искажения фотографий, препятствующего их использованию для обучения систем распознавания лиц и идентификации пользователей. В изображение вносятся пиксельные изменения, которые незаметны при просмотре людьми, но приводят к формированию некорректных моделей при использовании для тренировки систем машинного обучения. Код инструментария написан на языке Python и опубликован под лицензией BSD. Сборки подготовлены для Linux, macOS и Windows.

Обработка фотографий предложенной утилитой перед публикацией в социальных сетях и других публичных площадках позволяет защитить пользователя от использования данных фотографий в качестве источника для обучения систем распознавания лиц. Предложенный алгоритм предоставляет защиту от 95% попыток распознавания лиц (для API распознавания Microsoft Azure, Amazon Rekognition и Face++ эффективность защиты составляет 100%). Более того, даже если в будущем оригинальные, необработанные утилитой, фотографии будут использованы в модели, при обучении которой уже применялись искажённые варианты фотографий, уровень сбоев при распознавании сохраняется и составляет не менее 80%.

Метод основывается на феномене "состязательных примеров", суть которого в том, что несущественные изменения входных данных могут привести к кардинальным изменениям логики классификации. В настоящее время феномен "состязательных примеров" является одной из главных нерешённых проблем в системах машинного обучения. В будущем ожидается появление систем машинного обучения нового поколения, лишённых рассматриваемого недостатка, но эти системы потребуют значительных изменений в архитектуре и подходе к построению моделей.

Обработка фотографий сводится к добавлению в изображение комбинации пикселей (кластеров), которые воспринимаются алгоритмами глубинного машинного обучения как характерные для изображаемого объекта шаблоны и приводят к искажению признаков, применяемых для классификации. Подобные изменения не выделяются из общего набора и их чрезвычайно трудно обнаружить и удалить. Даже имея оригинальное и модифицированное изображения, проблематично определить, где оригинал, а где изменённая версия.

Вносимые искажения демонстрируют высокую стойкость против создания контрмер, нацеленных на выявления фотографий, нарушающих корректное построения моделей машинного обучения. В том числе не эффективны методы на основе размытия, добавления шумов или наложения фильтров на изображение для подавления пиксельных комбинаций. Проблема в том, что при наложении фильтров точность классификации падает значительно быстрее, чем определимость пиксельных шаблонов, и на том уровне когда искажения будут подавлены, уровень распознавания уже нельзя считать приемлемым.

Отмечается, что как и большинство других технологий для защиты конфиденциальности, предложенная техника может использоваться не только для борьбы с неавторизированным использованием публичных изображений в системах распознавания, но и как инструмент для скрытия злоумышленников. Исследователи полагают, что проблемы с распознаванием в основном могут коснуться сторонних сервисов, бесконтрольно и без разрешения собирающих информацию для обучения своих моделей (например, сервис Clearview.ai предлагает БД распознавания лиц, построенную на индексации около 3 миллиардов фотографий из социальных сетей). Если сейчас в коллекциях подобных сервисов находятся преимущественно достоверные изображения, но при активном использовании Fawkes, со временем, набор искажённых фотографий окажется больше и модель будет считать их более приоритетными для классификации. На системы распознавания спецслужб, модели которых строятся на основе достоверных источников, опубликованный инструментарий повлияет в меньшей степени.

Из близких по назначению практических разработок можно отметить проект Camera Adversaria, развивающий мобильное приложение для добавления на изображения шума Перлина, мешающего корректной классификации системами машинного обучения. Код Camera Adversaria доступен на GitHub под лицензией EPL. Другой проект Invisibility cloak нацелен на блокирование распознавания камерами наблюдения через создание специальных узорчатых плащей, футболок, свитеров, накидок, плакатов или шляп.

23.07.2020
https://www.opennet.ru/opennews/art.shtml?num=53414

altblitz · 24 Jul 2020

Понасиловал оба полушария своих и... не постиг с первого раза чтения.

> Метод основывается на феномене "состязательных примеров", суть которого в том, что несущественные изменения входных данных могут привести к кардинальным изменениям логики классификации. В настоящее время феномен "состязательных примеров" является одной из главных нерешённых проблем в системах машинного обучения.

Теперь, суть статьи стала ближе и понятней. Лишь чуть.

- А вот Котёнка Кисс, - стоило лишь молвить Блиц
- Хватит! Мы давно знаем, что она спортивна, умна и красива, в свои 14 юных лет! - заорал Хор Мальчиков Алкоголиков Античат
- ... И опознаёт она Блиц - за 5-10 метров, в маскере на лецо и тёмных поляризованных вело-очочках, - на этом завершил препирательства Блиц

1. Завтрак позволяй принести в постель свою (соблюдения соц.-дистанции ради)
2. Позаботься о "время - для себя", выбрав, например, местечко под Солнцем
3. Мой часто и тщательно лапки
4. Играй со своим персоналом в игры. Для расслабления и релаксации своей
5. Не допусти Corona-килораммы, играйся в кормление-игры
6. Отдыхай продолжительными сеансами и не падай духом!

(c) Anneke Brandt - Majesteit Nr. 132 augustus-september 2020

DartPhoenix · 24 Jul 2020

altblitz said: ↑

Понасиловал оба полушария своих и... не постиг с первого раза чтения.

> Метод основывается на феномене "состязательных примеров", суть которого в том, что несущественные изменения входных данных могут привести к кардинальным изменениям логики классификации. В настоящее время феномен "состязательных примеров" является одной из главных нерешённых проблем в системах машинного обучения.

Click to expand...

Я и с третьего раза не постиг. Если они собираются внедрять кривые пиксели в физиономии - у меня для них плохие новости.
Нейронка вполне способна генерировать лица а не только убирать с них артефакты, родинки и прочие свистоперделки.

Я х/з конечно... но что-то оно как-то мне не понимается.

altblitz · 24 Jul 2020

DartPhoenix said: ↑

Я и с третьего раза не постиг. Если они собираются внедрять кривые пиксели в физиономии - у меня для них плохие новости.
Нейронка вполне способна генерировать лица а не только убирать с них артефакты, родинки и прочие свистоперделки.

Я х/з конечно... но что-то оно как-то мне не понимается.
Click to expand...

КМК, reading of the very original article should and will be the eyes-opener.
(let's leave it close for this Friday morning)

Kevin Shindel · 30 Aug 2020

Мне кажется идея не взлетит ... просто системам понадобится чуть больше входных данных для тренировки.

DartPhoenix · 30 Aug 2020

Kevin Shindel said: ↑

Мне кажется идея не взлетит ... просто системам понадобится чуть больше входных данных для тренировки.
Click to expand...

Человек не всегда может распознать лица. Систему порадовать всегда способ найдется пока она не научится думать.

А когда она научится думать - у нас появится больше поводов для беспокойств...

Техника незаметного искажения фотографий для нарушения работы систем распознавания лиц

Suicide Super Moderator
Staff Member

altblitz Elder - Старейшина

DartPhoenix Elder - Старейшина

altblitz Elder - Старейшина

Kevin Shindel Elder - Старейшина

DartPhoenix Elder - Старейшина

Useful Searches

Техника незаметного искажения фотографий для нарушения работы систем распознавания лиц

Suicide Super Moderator Staff Member

altblitz Elder - Старейшина

DartPhoenix Elder - Старейшина

altblitz Elder - Старейшина

Kevin Shindel Elder - Старейшина

DartPhoenix Elder - Старейшина

Suicide Super Moderator
Staff Member