Технологии

Эксперты рассказали, как снизить риски ИИ-галлюцинаций

30.07.2025 12:40:00


Специалисты  назвали ключевые способы борьбы с галлюцинациями нейросетей.

Специалисты ВТБ назвали ключевые способы борьбы с галлюцинациями нейросетей — генерацией текста, который выглядит правдоподобно, но содержит вымышленные факты, неточные данные или ссылки на несуществующие источники. Подобные ошибки способны не только создать для пользователя серьезные затруднения при работе с информацией, но и привести к финансовым и репутационным рискам для бизнеса.


«Бывают случаи, когда нейросеть предлагает несуществующие книги в списке рекомендаций или формирует условия продукта, которых на самом деле нет. Модель не проверяет факты, а подбирает наиболее вероятный ответ, поэтому такие ошибки выглядят правдоподобно, но вводят в заблуждение. В первую очередь, снизить количество галлюцинаций можно за счет четко сформулированных запросов. Чем точнее и понятнее формулировка, тем меньше вероятность, что модель начнет фантазировать. Но все же самый надежный способ контроля — это внимательная проверка результата человеком», — сообщил Лев Меркушов, руководитель направления разработки ИИ-решений ВТБ.


Как отметил лидер команды по разработке моделей Алексей Пустынников, для предотвращения искажений информации со стороны ИИ важно понимать и учитывать и характер самих ошибок. Языковые модели не понимают смысл информации и не проверяют ее достоверность в реальном времени, поэтому сбои проявляются по-разному. В одних случаях система искажает проверяемые данные, в других — формирует вымышленные сведения или неправильно следует заданным инструкциям.


«Галлюцинации в работе языковых моделей можно условно разделить на несколько типов. Есть фактические галлюцинации, когда модель выдает проверяемую информацию с ошибками: например, указывает неправильное имя изобретателя или дату события, либо создает несуществующую связь между объектами. Есть фабрикация фактов, когда нейросеть просто придумывает данные, которые невозможно подтвердить, либо преувеличивает их значение. И отдельная группа — галлюцинации при следовании инструкциям: модель может выполнить другую операцию вместо заданной, не учесть контекст или допустить логические ошибки, например, утверждать, что дважды два равно шести», — сказал Алексей Пустынников.


Причины возникновения ИИ-галлюцинаций связаны с особенностями обучения и работы языковых моделей. Они формируют ответы на основе вероятностных связей в данных, а не на понимании фактов, поэтому при нехватке или противоречивости информации стремятся «додумать» ответ. Дополнительную роль играют ограничения обучающей выборки: модели не обладают сведениями о событиях, произошедших после окончания сбора данных, не имеют доступа к проверке фактов в реальном времени. В результате ошибки могут возникать как из-за недостатка знаний в редких областях, так и из-за неточностей или искажений, изначально содержащихся в используемых данных.


«Другой распространенной причиной ИИ-галлюцинаций являются сложные и абстрактные задачи, которые значительно повышают вероятность ошибок в работе больших языковых моделей. Чтобы снизить такие ошибки, мы рекомендуем использовать несколько подходов. Один из них — продуманная постановка вопросов и инструкций для модели, чтобы она лучше понимала задачу. Еще один способ — так называемая цепочка рассуждений, когда сложный запрос разбивают на простые шаги. Часто применяют и специальные системы, которые перед формированием ответа ищут информацию в проверенных базах данных. Кроме того, модели дообучают на данных из конкретной области, чтобы они лучше понимали термины и нюансы. А специальные защитные механизмы — AI guardrails — помогают отслеживать ответы и вовремя останавливать модель, если она выдает что-то неверное», — подчеркнул Лев Меркушов.


Отдельное внимание эксперты уделяют качеству исходных данных. «Один из базовых подходов — фильтрация данных, при котором в обучающие выборки включаются только тексты с минимальным количеством недостоверной информации и источники, в достоверности которых можно быть уверенными. Такой процесс нередко включает проверку материалов экспертами, что повышает качество, но одновременно увеличивает стоимость обучения моделей», — добавил Алексей Пустынников.


Эксперты ВТБ подчеркивают, что использование искусственного интеллекта требует не только технологической зрелости, но и ответственного отношения к качеству данных, прозрачности алгоритмов и контролю за результатами. Такой подход позволяет внедрять ИИ-инструменты, которые действительно помогают бизнесу, минимизируют ошибки и формируют устойчивое доверие со стороны клиентов.

Читайте также

Т2 запустила безлимит на мессенджер MAX

T2 запускает безлимит на MAX на фоне интереса к новому сервису. Новый мессенджер продемонстрировал десятикратный рост аудитории в период с 4 по 20 июня, что обусловлено высоким публичным интересом к проекту.

18.07.2025

В Тверской области появилась памятка на случай замедления мобильного интернета

Минцифры региона дает рекомендации жителям на тот случай, когда привычная услуга связи недоступна.

18.07.2025

В Твери, как на курорте: в городе открыли фотовыставку и зону релакса T2

T2 приглашает тверичей провести лето на свежем воздухе. В Городском саду компания открыла фотовыставку о самых удивительных местах области и обустроила зону отдыха. А на центральном пляже рядом со спортплощадками — установила велопарковки, чтобы жителям было проще добираться сюда для тренировок и плавания.

15.07.2025

Разбираем отраслевой рейтинг "Финансовые услуги" по видимости в SEO

В топ-30 вошли  финтех-сайты компаний, которые модернизировали свой сайт под новые поисковые ИИ- интерфейсы.

14.07.2025

Клиенты Т2 могут обменять минуты и Гб на поездки по всем платным трассам сети «Автодор»

T2, российский оператор мобильной связи, вновь расширяет возможности обмена неизрасходованного трафика. Теперь минуты и гигабайты можно обменять на оплату поездок по всей сети «Автодор» – трассам М-4 «Дон», М-11 «Нева» и М-12 «Восток» из Москвы в другие регионы в южном, северном и восточном направлениях.

10.07.2025

Нейросеть в три раза повысила эффективность выявление нарушений на ЕГЭ

Нарушения во время экзаменов контролировали свыше 15,7 тысяч наблюдателей и искусственный интеллект, который анализировал поведение выпускников на экзамене.

10.07.2025

В 2025 году Т2 предотвратила полмиллиарда спам-звонков – это сэкономило 95 лет времени клиентов

За первую половину 2025 года Т2 уберегла своих абонентов примерно от трех миллиардов секунд нежелательного телефонного взаимодействия. Это эквивалентно 95 годам «молчания» раздражающего спама.

09.07.2025

Подведены федеральные итоги конкурса «Вместе в цифровое будущее»

«Ростелеком» подвел итоги 14-го конкурса региональных журналистов и блогеров «Вместе в цифровое будущее».

08.07.2025

Рекомендуемое

Политика

Новые наказания и повышенные тарифы ждут россиян в августе

В августе в России начнут действовать новые законы и изменения в разных сферах жизни.

31.07.2025

Погода

На запад Тверской области надвигается грозовой фронт

При грозе ветер может усилиться до 17 м/с.

30.07.2025

Происшествия

В Твери задержан подозреваемый в ночном убийстве на бульваре Гусева

Мужчина сбежал с места преступления, но был найден угрозыском по горячим следам.

29.07.2025

Общество

В небе над Калининским районом сбиты два БПЛА

Об атаке беспилотников сообщил глава региона.

19.07.2025

Технологии

В Тверской области появилась памятка на случай замедления мобильного интернета

Минцифры региона дает рекомендации жителям на тот случай, когда привычная услуга связи недоступна.

18.07.2025

Происшествия

В Тверской области цыгане вымогали у участников СВО деньги

Сумма присвоенных таким образом средств составила более 4 млн рублей.

17.07.2025

Погода

На запад и центр Тверской области надвигается гроза

Штормовое предупреждение объявлено МЧС.

17.07.2025

Происшествия

На М10 под Бологое неизвестный сбил насмерть одного и ранил двух пешеходов

На месте происшествия работают сотрудники оперативных служб.

15.07.2025