11 признаков, что изображение сгенерировано искусственным интеллектом

Настоящие фотографии и произведения искусства, созданные вручную, обладают глубиной и подлинностью, с которыми не может сравниться искусственный интеллект. Некоторые изображения, сгенерированные искусственным интеллектом, выглядят потрясающе реалистично, но при ближайшем рассмотрении часто обнаруживаются едва заметные недостатки. Как только вы сможете заметить эти несоответствия, иллюзия быстро разрушится.

Глаза, которые не похожи на человеческие

Если вы когда-нибудь сталкивались с портретом, который сидит не так, как надо, в этом часто виноваты глаза. ИИ может создавать восхитительные произведения искусства, но ему сложно уловить человеческие эмоции и тонкие детали глаз, в результате чего взгляд кажется пустым, несоответствующим или просто тревожным.

Зрачки могут быть неправильно расположены, одна радужная оболочка может казаться больше другой, а взгляду может не хватать естественной глубины, которая придает человеческим лицам живое выражение. Вместо этого вы часто видите безжизненные выражения, лишенные всякого содержания. Эмоциональный разрыв едва уловим, но глубоко обескураживает, часто вызывая немедленное недоверие без понимания причин.

Интересно: Норвегия ограничивает доступ к ИИ в школах

Искаженные логотипы на рекламных плакатах

Брендинг редко бывает точным на изображениях, сгенерированных искусственным интеллектом. Вы можете увидеть логотип Nike, искаженный или слитый с элементами другого бренда, или случайные символы, похожие на логотипы, но не существующие.

Такие искажения свидетельствуют об отсутствии у модели понимания контекста, и их легко заметить, если вы знакомы с брендом, которому подражаете. Чаще всего несоответствия проявляются в более мелких деталях – например, в толщине шрифта, интервале между буквами или форме конкретного объекта. Это особенно очевидно, когда Ai пытается объединить несколько логотипов в один.

Интересно, что в ходе тестирования я заметил, что почти каждый генератор изображений AI стремится вставить логотип Coca Cola (или его похожий вариант) в любую сцену, где это имеет смысл, и большинство из них способны воспроизвести его довольно точно. Это наводит меня на мысль, что многие пользователи запрашивают именно этот логотип, и в результате модели ИИ были обучены генерировать его чаще, чем другие Бренды.

Отражения в зеркале

Зеркала, вода и стекло могут легко выявить недостатки искусственного интеллекта. Отражения могут полностью отсутствовать или содержать несовпадающие или искаженные элементы, что сразу же противоречит реальному расположению изображений.

В некоторых случаях можно заметить отражения, содержащие лишние конечности или объекты, отсутствующие на основном изображении. В других крайних случаях отражение буквально выходит из зеркала и становится частью окружающего мира. Такие изображения, созданные искусственным интеллектом, могут показаться вам снимком из фильма ужасов начала 2000-х годов.

В то время как реальный мир подчиняется законам физики и света, изображения ИИ часто не подчиняются им. Чем больше отражающих поверхностей, тем больше шансов для появления таких несоответствий.

Нелепая архитектура

ИИ может имитировать архитектурный стиль, но со структурой у него проблемы. Присмотритесь к зданиям на изображениях, созданных ИИ, и вы часто обнаружите элементы дизайна, которые не имеют никакого практического или физического смысла.

Лестницы могут вести прямо в стены. Дверные проемы парят над землей, и до них невозможно добраться. Окна могут казаться прижатыми друг к другу или странно расположенными, как будто случайно скопированными и вставленными из других зданий. Крыши иногда пересекаются под невозможными углами, а опорные колонны могут раствориться в воздухе или пронзить этаж без всякой логики.

ИИ не понимает ни инженерного дела, ни гравитации – он угадывает их по визуальным шаблонам. В результате часто получаются конструкции, которые на первый взгляд выглядят как здания, но при ближайшем рассмотрении разваливаются на части.

Фон, который не складывается в единое целое

На первый взгляд, передний план изображения может показаться убедительным. Но только до тех пор, пока вы не заметите на заднем плане нечто обескураживающее.

Дерево, растущее из крыши, Люди, парящие чуть выше земли, Эйфелева башня, установленная на парковке в пригороде. Фигуры могут казаться наполовину слившимися с объектами, сливающимися со зданиями, машинами или заборами, как визуальные глюки.

Иногда кажется, что масштаб не тот: кошка размером с почтовый ящик или уличный фонарь, едва достигающий уровня глаз. В других случаях вместо реальных объектов вы увидите неопознаваемые пятна или текстуры, которым не место в мире природы.

ИИ может подделать детали, но зачастую он не может разместить их там, где они имеют смысл. Некоторые художественные генераторы ИИ способны создавать фотореалистичные результаты, но даже самые продвинутые из них пытаются создать чистый, логичный фон. В результате получается сцена, которая выглядит правдоподобно, если сильно прищурить глаза.

Размытые люди на фоне

Как и в предыдущем случае, люди на заднем плане обычно имеют низкий приоритет в рендерах ИИ. В результате они часто выглядят размытыми, неполными или скрюченными в невозможных позах.

У этих призрачных фигур могут быть размытые или нечеткие черты лица, а их позы могут вызывать удивление. Конечности могут странным образом накладываться друг на друга, а головы – парить над шеей нарушая физические законы. В групповых сценах вы можете заметить повторяющиеся лица, зеркальные прически или людей, застывших в одной позе и одетых в странно похожую одежду.

Для искусственного интеллекта фоновые фигуры служат визуальными послесловиями. Они становятся тревожными силуэтами, которые раскрывают искусственное происхождение изображений. Каким бы четким ни был передний план, эти объекты – явный признак того, что перед вами не органическое изображение.

Следующие признаки относятся только к старым генераторам AI-изображений, поскольку новые модели значительно продвинулись вперед и могут больше не проявлять этих проблем.

Чрезмерное сглаживание и пластичная кожа

У людей, сгенерированных искусственным интеллектом, кожа часто выглядит так, будто ее отшлифовали. Это связано с тем, как ИИ обрабатывает черты лица и текстуры; он склонен отдавать предпочтение гладкости, а не реалистичности.

Поры исчезают. Морщины, веснушки и шрамы стираются. В результате получается восковой, слишком отполированный цвет лица, которому не хватает текстуры настоящей кожи. Часто этот эффект разглаживания распространяется не только на лицо, но и на шею, руки и даже одежду. Это создает странный искусственный вид.

Существует множество генераторов искусственного интеллекта, которые могут создавать изображения из текста, но большинство из них страдают именно от этой проблемы. Только новые модели, такие как GPT-4o, могут создавать невероятно реалистичные изображения, избегая предметов с пластиковой кожей.

Руки, которые не имеют анатомического смысла

Это один из самых очевидных признаков. ИИ уже давно не справляется с точным рендерингом рук, и, несмотря на достигнутые улучшения, искаженные цифры все еще являются явным признаком.

Ищите дополнительные пальцы, сросшиеся суставы, неестественные изгибы или пальцы, выходящие из ладоней. Поскольку ИИ не понимает анатомию человека, он часто создает беспорядочную картину.

Особенно показательны большие пальцы. Если вы увеличите масштаб и внимательно рассмотрите их, то, скорее всего, обнаружите что-то странное. Иногда все руки расположены под невозможными углами, кажутся слишком маленькими или большими по отношению к телу.

«Тающий» текст или тарабарские буквы

Генерируемые искусственным интеллектом изображения неизменно терпят неудачу, когда дело доходит до текста. Запросите уличный знак или этикетку товара, и вы часто получите беспорядочные, нечитаемые символы, напоминающие последствия ошибки в Scrabble.

Модели искусственного интеллекта, генерирующие изображения, обучаются на визуальных данных, а не на понимании языка. В результате они часто выдают похожие на буквы фигуры, которые имитируют текст, не образуя настоящих, читаемых слов. Даже если слово кажется узнаваемым на первый взгляд, при ближайшем рассмотрении обычно обнаруживаются лишние штрихи, несоответствующий Шрифт или интервалы между буквами, которые не имеют смысла.

Важно отметить, что некоторые продвинутые модели способны генерировать разборчивый текст, хотя иногда вы все равно можете заметить небольшие несоответствия.

Существуют инструменты, с помощью которых можно исправить тарабарский текст на изображениях, сгенерированных искусственным интеллектом, но не все они эффективны.

Неправильные источники света

Ошибки в освещении – еще один частый тревожный сигнал. Вы можете увидеть тени, направленные в разные стороны, или человека, освещенного слева и отбрасывающего тень в том же направлении. Тени могут быть слишком мягкими, слишком резкими или полностью отсутствовать.

Хотя большинство людей не являются экспертами в области освещения, все мы интуитивно понимаем, как должен вести себя свет.

Сечинов Михаил Эксперт по компьютерному железу

Один из основателей проекта ITShaman.ru. Я люблю компьютерное железо. Люблю Intel, но дома и на работе использую AMD. Из-за этого много экспериментирую и тестирую.