Почему современные детекторы не могут точно определить, где текст написан ИИ

ИИ-детекторы не способны надёжно отличать машинные тексты от человеческих, особенно когда речь идёт о творческом или отредактированном контенте.

Нурлан Бекмуратов 644 Views
Клавиатура. Фото - Pixabay

Современные технологии машинного обучения позволяют создавать тексты, которые почти невозможно отличить от человеческих. Об этом рассказал профессор Амбудж Тевари из Мичиганского университета в материале The Conversation, пишет КТРК.

Проблема заключается не только в сложности алгоритмов, но и в том, что сами ИИ-модели становятся всё лучше, обучаясь на текстах, созданных людьми. Поэтому, даже если текст выглядит «естественным», он вполне может быть результатом генерации. Это создаёт трудности для школ, университетов и редакций, которые хотят знать, кто действительно автор текста.

Как работают системы обнаружения ИИ-контента

Главный принцип детекторов прост: программа анализирует текст и вычисляет вероятность того, что он создан искусственным интеллектом. Такой анализ может опираться на:

  • частоту и предсказуемость слов,
  • стиль написания и логику изложения,
  • статистические совпадения с текстами, известными как ИИ-сгенерированные.

Однако на практике многое зависит от модели, на которой обучен сам детектор. Если она не знает конкретных алгоритмов, использованных при создании текста, вероятность ошибки резко возрастает.

Почему точность таких систем ограничена

Даже самые продвинутые детекторы сталкиваются с рядом проблем. Во-первых, ИИ-модели быстро обновляются, и инструменты анализа не успевают адаптироваться. Во-вторых, текст, сгенерированный нейросетью и затем немного отредактированный человеком, часто не имеет характерных признаков машинного письма.

Исследования показывают, что обученные люди могут иногда точнее распознавать ИИ-контент, чем автоматические алгоритмы, но такой навык редок и не может использоваться массово. Поэтому институты всё чаще применяют смешанный подход — автоматическую проверку с последующей экспертной оценкой.

Водяные знаки и попытки сделать ИИ-контент отслеживаемым

Некоторые разработчики ИИ внедряют скрытые «водяные знаки» — специальные паттерны в тексте, которые невозможно заметить глазами. По уникальному коду можно позже подтвердить, что материал действительно создан машиной.

Однако этот метод требует сотрудничества со стороны разработчиков ИИ и не работает для старых или открытых моделей. Кроме того, пользователи могут легко удалить такие метки при редактировании, что делает систему непригодной для массового применения.

Что ждёт технологии обнаружения дальше

Пока не существует инструмента, который бы с абсолютной точностью определял происхождение текста. И чем совершеннее становятся генеративные модели, тем сложнее отличить их от человека. Эксперты считают, что общество должно учиться сосуществовать с этой неопределённостью и формировать новые нормы использования искусственного интеллекта в образовании, рекламе и науке.

Напомним, ранее мы писали о том, что искусственный интеллект изменил язык, создав новые слова и культурные тренды 2025 года.

Поделиться