Инструмент обнаружения Ai от Google

Сечинов Михаил

Google объявила на сайте X (бывший Twitter), что SynthID теперь доступен для всех желающих. Система аутентификации для контента, созданного искусственным интеллектом, встраивает незаметные водяные знаки в созданные изображения, видео и текст, позволяя пользователям проверить, был ли контент создан человеком или машиной.

Мы выложили в открытый доступ наш инструмент для создания водяных знаков SynthID Tex. Доступный разработчикам и компаниям, он поможет им идентифицировать контент, созданный искусственным интеллектом.
– пишет компания

SynthID дебютировал в 2023 году как средство для нанесения водяных знаков на созданные ИИ изображения, аудио и видео. Изначально она была интегрирована в Imagen, а в мае 2024 на I/O компания объявила о ее внедрении в чатбот Gemini.

Система работает путем кодирования токенов – основополагающих фрагментов данных (будь то отдельный символ, слово или часть фразы), которые генеративный ИИ использует для понимания запроса и предсказания следующего слова в своем ответе, – незаметными водяными знаками в процессе создания текста. Как сообщается в блоге DeepMind, он вносит дополнительную информацию в распределение лексем в момент генерации, изменяя вероятность появления лексем.

Сравнивая выбор слов в модели и скорректированные оценки вероятности с ожидаемой моделью оценок для текста с водяными знаками и без них, SynthID может определить, написал ли это предложение искусственный интеллект.

Согласно исследованию, опубликованному в журнале Nature, этот процесс не влияет на точность, качество или скорость ответов, и его нельзя легко обойти. В отличие от стандартных метаданных, которые можно легко удалить и стереть, водяной знак SynthID, как сообщается, остается даже в том случае, если контент был обрезан, отредактирован или иным образом изменен.

Достижение надежного и незаметного водяного знака для текста, созданного ИИ, является принципиально сложной задачей, особенно в сценариях, где результаты работы больших языковых моделей практически детерминированы, например, при решении фактологических вопросов или задач генерации кода. Открытый исходный код позволяет сообществу тестировать эти детекторы и оценивать их устойчивость в различных условиях, что помогает лучше понять ограничения этих методов.
- сказал Сохейл Фейзи, доцент Мэрилендского университета, в интервью MIT Technology Review

Однако система не является надежной. Несмотря на устойчивость к взлому, водяные знаки SynthID могут быть удалены, если текст пропустить через приложение для перевода на другой язык или сильно переписать. Кроме того, он менее эффективен при работе с короткими отрывками текста и при определении того, был ли ответ, основанный на фактах, сгенерирован искусственным интеллектом. Например, на вопрос «Что является столицей Франции?» есть только один правильный ответ, и как человек, так и ИИ скажут вам, что это Париж.

Если вы хотите попробовать SynthID самостоятельно, его можно загрузить с сайта Hugging Face как часть обновленного инструментария Responsible GenAI Toolkit от Googles.