Перейти к основному содержанию
Реклама
Прямой эфир
Наука и техника
Медведев указал на масштабность открытий российских ученых
Общество
Похититель собак Пай не признал вину в жестоком обращении с животными
Мир
Дегтярев отметил широкое спортивное сотрудничество России и Китая
Мир
Лавров напомнил американской стороне о достигнутых в Анкоридже договоренностях
Общество
Путин подписал закон о защите исторической правды
Спорт
Мексика согласилась принять сборную Ирана на время ЧМ-2026
Авто
В России упростили порядок отстранения от управления авто в пьяном виде
Мир
Лавров предупредил США о начале системных ударов РФ по военным объектам Киева
Мир
Археологи нашли 100 золотых украшений возрастом 1,1 тыс. лет в Саудовской Аравии
Спорт
«Зенит» объявил об уходе защитника Арсена Адамова
Спорт
Разбитый футболистами «Спартака» Кубок России изготовят заново и передадут клубу
Спорт
ХК «Автомобилист» расторг контракт с лучшим бомбардиром сезона
Мир
Глава МИД Эстонии выступил против посредничества ЕС в переговорах по Украине
Армия
Силы ПВО за 12 часов сбили 14 беспилотников ВСУ над регионами России
Мир
Захарова заявила о брошенном России вызове
Спорт
ФК «Милан» сменил руководство после невыхода в ЛЧ
Мир
SHAMAN опубликовал видео у посольства США и рассказал о папке со списком фамилий

Российские исследователи научились выявлять и устранять ошибки в генерации ответов ИИ

0
EN
Фото: РИА Новости/Владимир Трефилов
Озвучить текст
Выделить главное
Вкл
Выкл

Исследователи из лаборатории искусственного интеллекта (ИИ) T-Bank AI Research разработали новый способ интерпретации и управления языковыми моделями на основе метода SAE Match. Открытие позволяет напрямую влиять на ошибки и галлюцинации в большой языковой модели во время генерации текста. Об этом сообщили в научной лаборатории Т-Банка.

Языковые модели, такие как ChatGPT, строят свои ответы на основе многослойной архитектуры, где каждый слой обрабатывает информацию, «передавая» ее дальше. До последнего времени исследователи могли только фиксировать, какие признаки (или концепты) появляются в этих слоях, не понимая, как именно они эволюционируют.

Новый метод позволяет получить информацию, откуда модель взяла данные — из контекста запроса или внутренних данных, и контролировать ее поведение, предотвращая выдачу некорректных ответов. Он не требует дополнительных вычислительных ресурсов, его могут использовать любые компании. Это позволяет напрямую исправлять ошибки в конкретном месте, что позволит избежать больших затрат на дообучение моделей.

Эксперименты показали, что можно усиливать или подавлять определенные признаки на разных этапах обработки, тем самым изменяя стиль, тематику или тональность генерируемого текста. Это особенно важно для создания безопасных и этичных решений на базе ИИ — например, для фильтрации нежелательных тем в чат-ботах без их переобучения.

Результаты исследования были представлены на международной конференции по машинному обучению (ICML), которая прошла в Ванкувере 13-19 июля. Это одна из главных конференция в области машинного обучения и искусственного интеллекта.

Читайте также
Прямой эфир