Перейти к основному содержанию
Реклама
Прямой эфир
Общество
Патриарх Кирилл поздравил православных христиан с Пасхой
Мир
СМИ узнали о готовности ХАМАС к сделке по прекращению огня с Израилем
Мир
Politico узнала о выделении Байденом военной помощи Гаити на $60 млн
Мир
Израильская полиция задержала охрану греческого консула в храме в Иерусалиме
Общество
Синоптики спрогнозировали небольшой дождь и порывистый ветер в Москве 5 мая
Общество
Правительство утвердило создание комиссий по противодействию нелегальной занятости
Мир
Глава минэнерго Украины заявил о крупных убытках и сложной ситуации в отрасли
Мир
Макрон заявил о необходимости сохранять возможность переговоров с Россией
Армия
Зенитчики ВС РФ уничтожили над Херсонской областью ударный беспилотник Warmate
Общество
СК возбудил дело после повреждения мемориала «Погибшим солдатам» в Ленобласти
Мир
Потомки ветеранов Великой Отечественной войны провели в их память шествие в Нью-Йорке
Мир
В Аргентине свыше сотни людей вышли на акцию «Бессмертный полк»
Происшествия
МЧС сообщило о ликвидации пожара на складе в Симферополе площадью 1 тыс. кв. м
Мир
Захарова прокомментировала проверки пассажиров из РФ в аэропорту Кишинева
Армия
Специалисты МТО подготовили к Пасхе десятки тысяч куличей и яиц для бойцов ВС РФ
Мир
Политолог назвал объявление Зеленского в розыск сигналом для других стран
Армия
Пилот Су-30CМ после боевого дежурства над зоной СВО рассказал о своем талисмане

Российские специалисты научили смартфон читать по губам

0
Фото: ИЗВЕСТИЯ/Павел Волков
Озвучить текст
Выделить главное
вкл
выкл

Сотрудники Санкт-Петербургского федерального исследовательского центра РАН обучили искусственный интеллект понимать русскую речь по движениям губ человека, рассказали в Минобрнауки.

Программу можно установить на любой смартфон с видеокамерой. Это первая нейросеть в мире, способная понимать таким способом русский язык.

Разработку придумали, чтобы сделать возможным использование электронных голосовых ассистентов в условиях шума. Теперь их помощью смогут воспользоваться водители грузовых автомобилей, пилоты и другие профессионалы, работа которых связана с оборудованием, издающим громкие звуки.

«Мы разработали приложение для смартфона, которое распознает звучащую речь и считывает по губам слова пользователя, анализируя видеосигнал с камеры гаджета. Программа совмещает и изучает информацию из двух источников для улучшения точности распознавания. Эксперименты показали, что такая гибридная система значительно эффективнее распознает команды человека в сложных и шумных условиях», — рассказал старший научный сотрудник лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН Денис Иванько.

Перед учеными стояла цель — добиться от нейросети лучшего понимания человека посредством визуальных и звуковых сигналов. Чтобы этого добиться, они использовали метод машинного обучения. Материалом для нейросети стали видео со звуком, где человек произносит определенные слова. Так компьютер научился понимать самые обыденные и часто используемые команды.

К тому же он сам может определить, как добиться максимальной точности распознавания слов, по звуку или по картинке.

Качество работы системы уже успешно испытали в условиях реальной работы водители грузовых машин российских транспортных компаний. Для этого приложение установили на их телефоны. Оказалось, что по картинке слова распознаются с точностью 60–80%, а вместе со звуком этот показатель вырос до 90%.

Подробнее читайте в эксклюзивном материале «Известий»:

Понять на слове: российские специалисты научили смартфон читать по губам

Прямой эфир