Когда пишет нейросеть, а краснеть приходится человеку
Директор агентства Gosapp Digital Захар Рубцов – о том, почему Википедия запретила публиковать материалы, написанные ИИ.
На календаре 1 апреля, и если вы читаете этот пост – значит, вы разобрались, как найти альтернативный путь для подключения к Telegram. А, возможно, у вас и так всё работает? В любом случае, новостей за неделю было много, и раз уж у нас с вами рубрика про нейросети, то предлагаю обсудить довольно любопытную тему. Но сперва скажите: «Вы давно читали статьи на Википедии?»
Оказалось, что не так давно Википедия запретила публиковать материалы, которые были написаны ИИ. Основная причина в том, что сгенерированные тексты зачастую нарушают правила контента, да и часто галлюцинируют (пишут чушь, проще говоря). У редакторов уходит много времени на то, чтобы вычитывать и исправлять материалы.
Получается интересная ситуация: нейросетевых текстов в интернете становится всё больше, и как показывают некоторые исследования, многие люди попросту не могут определить, кто автор – человек или алгоритм. Да, современные нейросети могут писать на уровне журналистов, генерировать статьи и сочинять стихи в стиле Пушкина. Но по-прежнему страдает смысл, заложенный в эти работы. Возможно, упаковка (то есть стиль) и будет похожа на Пушкина, но вот глубина останется на уровне какого-нибудь «ноунейма с ЖЖ» (ЖЖ ещё по-прежнему существует, сам в шоке).
Языковые модели достаточно хорошо оптимизированы под связность и читаемость текста, а не под его точность. Отсюда и берутся знаменитые «галлюцинации», когда ИИ уверенно называет несуществующие книги, придумывает научные исследования или приписывает реальным людям цитаты, которых те никогда не говорили. Именно поэтому Википедия и решила пойти на крайние меры, запретив работу ИИ по части фактажа (а заодно и попиариться на этом лишний раз).
Но что интересно: параллельно с запретами формируются более тонкие механизмы регулирования. Частично платформы уже начинают вводить маркировку ИИ-контента. И можно предположить, что уже совсем скоро в интернете появится что-то вроде «знака качества». Этим знаком будут отмечать контент, сделанный человеком (хотя бы на сколько-нибудь процентов). Поэтому важно помнить, что алгоритмы меняются, платформы появляются и исчезают, а вот доверие к человеку (или команде), накопленное годами, остаётся самым устойчивым активом в любой информационной среде.















