Технологии
Эксперты рассказали, как снизить риски ИИ-галлюцинаций
30.07.2025 12:40:00
Специалисты назвали ключевые способы борьбы с галлюцинациями нейросетей.
Специалисты ВТБ назвали ключевые способы борьбы с галлюцинациями нейросетей — генерацией текста, который выглядит правдоподобно, но содержит вымышленные факты, неточные данные или ссылки на несуществующие источники. Подобные ошибки способны не только создать для пользователя серьезные затруднения при работе с информацией, но и привести к финансовым и репутационным рискам для бизнеса.
«Бывают случаи, когда нейросеть предлагает несуществующие книги в списке рекомендаций или формирует условия продукта, которых на самом деле нет. Модель не проверяет факты, а подбирает наиболее вероятный ответ, поэтому такие ошибки выглядят правдоподобно, но вводят в заблуждение. В первую очередь, снизить количество галлюцинаций можно за счет четко сформулированных запросов. Чем точнее и понятнее формулировка, тем меньше вероятность, что модель начнет фантазировать. Но все же самый надежный способ контроля — это внимательная проверка результата человеком», — сообщил Лев Меркушов, руководитель направления разработки ИИ-решений ВТБ.
Как отметил лидер команды по разработке моделей Алексей Пустынников, для предотвращения искажений информации со стороны ИИ важно понимать и учитывать и характер самих ошибок. Языковые модели не понимают смысл информации и не проверяют ее достоверность в реальном времени, поэтому сбои проявляются по-разному. В одних случаях система искажает проверяемые данные, в других — формирует вымышленные сведения или неправильно следует заданным инструкциям.
«Галлюцинации в работе языковых моделей можно условно разделить на несколько типов. Есть фактические галлюцинации, когда модель выдает проверяемую информацию с ошибками: например, указывает неправильное имя изобретателя или дату события, либо создает несуществующую связь между объектами. Есть фабрикация фактов, когда нейросеть просто придумывает данные, которые невозможно подтвердить, либо преувеличивает их значение. И отдельная группа — галлюцинации при следовании инструкциям: модель может выполнить другую операцию вместо заданной, не учесть контекст или допустить логические ошибки, например, утверждать, что дважды два равно шести», — сказал Алексей Пустынников.
Причины возникновения ИИ-галлюцинаций связаны с особенностями обучения и работы языковых моделей. Они формируют ответы на основе вероятностных связей в данных, а не на понимании фактов, поэтому при нехватке или противоречивости информации стремятся «додумать» ответ. Дополнительную роль играют ограничения обучающей выборки: модели не обладают сведениями о событиях, произошедших после окончания сбора данных, не имеют доступа к проверке фактов в реальном времени. В результате ошибки могут возникать как из-за недостатка знаний в редких областях, так и из-за неточностей или искажений, изначально содержащихся в используемых данных.
«Другой распространенной причиной ИИ-галлюцинаций являются сложные и абстрактные задачи, которые значительно повышают вероятность ошибок в работе больших языковых моделей. Чтобы снизить такие ошибки, мы рекомендуем использовать несколько подходов. Один из них — продуманная постановка вопросов и инструкций для модели, чтобы она лучше понимала задачу. Еще один способ — так называемая цепочка рассуждений, когда сложный запрос разбивают на простые шаги. Часто применяют и специальные системы, которые перед формированием ответа ищут информацию в проверенных базах данных. Кроме того, модели дообучают на данных из конкретной области, чтобы они лучше понимали термины и нюансы. А специальные защитные механизмы — AI guardrails — помогают отслеживать ответы и вовремя останавливать модель, если она выдает что-то неверное», — подчеркнул Лев Меркушов.
Отдельное внимание эксперты уделяют качеству исходных данных. «Один из базовых подходов — фильтрация данных, при котором в обучающие выборки включаются только тексты с минимальным количеством недостоверной информации и источники, в достоверности которых можно быть уверенными. Такой процесс нередко включает проверку материалов экспертами, что повышает качество, но одновременно увеличивает стоимость обучения моделей», — добавил Алексей Пустынников.
Эксперты ВТБ подчеркивают, что использование искусственного интеллекта требует не только технологической зрелости, но и ответственного отношения к качеству данных, прозрачности алгоритмов и контролю за результатами. Такой подход позволяет внедрять ИИ-инструменты, которые действительно помогают бизнесу, минимизируют ошибки и формируют устойчивое доверие со стороны клиентов.
Читайте также
T2 запускает безлимит на MAX на фоне интереса к новому сервису. Новый мессенджер продемонстрировал десятикратный рост аудитории в период с 4 по 20 июня, что обусловлено высоким публичным интересом к проекту.
18.07.2025
Минцифры региона дает рекомендации жителям на тот случай, когда привычная услуга связи недоступна.
18.07.2025
T2 приглашает тверичей провести лето на свежем воздухе. В Городском саду компания открыла фотовыставку о самых удивительных местах области и обустроила зону отдыха. А на центральном пляже рядом со спортплощадками — установила велопарковки, чтобы жителям было проще добираться сюда для тренировок и плавания.
15.07.2025
В топ-30 вошли финтех-сайты компаний, которые модернизировали свой сайт под новые поисковые ИИ- интерфейсы.
14.07.2025
T2, российский оператор мобильной связи, вновь расширяет возможности обмена неизрасходованного трафика. Теперь минуты и гигабайты можно обменять на оплату поездок по всей сети «Автодор» – трассам М-4 «Дон», М-11 «Нева» и М-12 «Восток» из Москвы в другие регионы в южном, северном и восточном направлениях.
10.07.2025
Нарушения во время экзаменов контролировали свыше 15,7 тысяч наблюдателей и искусственный интеллект, который анализировал поведение выпускников на экзамене.
10.07.2025
За первую половину 2025 года Т2 уберегла своих абонентов примерно от трех миллиардов секунд нежелательного телефонного взаимодействия. Это эквивалентно 95 годам «молчания» раздражающего спама.
09.07.2025
«Ростелеком» подвел итоги 14-го конкурса региональных журналистов и блогеров «Вместе в цифровое будущее».
08.07.2025
Рекомендуемое
Политика
Новые наказания и повышенные тарифы ждут россиян в августеВ августе в России начнут действовать новые законы и изменения в разных сферах жизни.
31.07.2025
Погода
На запад Тверской области надвигается грозовой фронтПри грозе ветер может усилиться до 17 м/с.
30.07.2025
Происшествия
В Твери задержан подозреваемый в ночном убийстве на бульваре ГусеваМужчина сбежал с места преступления, но был найден угрозыском по горячим следам.
29.07.2025
Общество
В небе над Калининским районом сбиты два БПЛАОб атаке беспилотников сообщил глава региона.
19.07.2025
Технологии
В Тверской области появилась памятка на случай замедления мобильного интернетаМинцифры региона дает рекомендации жителям на тот случай, когда привычная услуга связи недоступна.
18.07.2025
Происшествия
В Тверской области цыгане вымогали у участников СВО деньгиСумма присвоенных таким образом средств составила более 4 млн рублей.
17.07.2025
Погода
На запад и центр Тверской области надвигается грозаШтормовое предупреждение объявлено МЧС.
17.07.2025
Происшествия
На М10 под Бологое неизвестный сбил насмерть одного и ранил двух пешеходовНа месте происшествия работают сотрудники оперативных служб.
15.07.2025