Перейти к основному содержанию
Реклама
Прямой эфир
Армия
Расчеты РСЗО «Град» уничтожили опорные пункты и живую силу ВСУ в Курской области
Мир
Бюджет Японии в 2025 фингоду может составить рекордную сумму из-за расходов на оборону
Армия
Средства ПВО за ночь поразили 59 украинских беспилотников над регионами России
Армия
Главный центр связи Генштаба ВС РФ наградили орденом Суворова
Общество
В аэропорту Казани ввели временные ограничения на полеты
Экономика
В РФ средние зарплатные предложения в нефтегазовой отрасли за год выросли на 21%
Происшествия
Сотрудники МЧС спасли пропавшего в Хабаровске мужчину
Наука и техника
Исследователи из Франции узнали о вреде ремешков смарт-часов для здоровья
Общество
В Республике Башкортостан задержали председателя госкомитета за получение взятки
Армия
Более 200 единиц вооружения и техники было передано добровольцам отрядов БАРС
Культура
Театр Пушкина отметил 110-летний юбилей премьерой «Плохие хорошие» Оскара Уайльда
Экономика
В России почти 891 млн нелегальных товаров было заблокировано в 2024 году
Армия
ВСУ начали использовать в зоне СВО американские дробовики
Общество
В России с 2025 года начнет действовать ГОСТ на шаурму
Общество
Синоптики спрогнозировали небольшие осадки и гололед в Москве 25 декабря
Происшествия
Почти 5 тыс. человек остались без отопления из-за коммунальной аварии в Иваново
Общество
В России хотят фиксировать цену на билеты РЖД на новогодних праздниках
Общество
Продажи элитного жилья в 2024 году выросли на треть
Главный слайд
Начало статьи
Озвучить текст
Выделить главное
Вкл
Выкл

Новое мобильное приложение, разработанное российскими учеными, поможет улучшить речевые навыки пациентов. С его помощью они смогут самостоятельно проводить логопедические занятия, контролируя при этом как произношение, так и артикуляцию. Такие возможности программы обеспечат нейросети, настроенные на распознавание звука и изображений. Технологию предлагают использовать для реабилитации людей после инсульта, коррекции произношения звуков у детей. Дальнейшее ее развитие может привести к созданию систем видеоаналитики, которые смогут читать по губам. Это может пригодиться, например, при расшифровке разговоров с камер видеонаблюдения.

Идеальное сравнение

Правильное произношение различных звуков зависит от артикуляции, которая определяется положением губ и языка человека. Проследить за ней сейчас может только логопед, который контролирует данные параметры при работе с людьми с нарушениями речи. Российские ученые разработали программу анализа артикуляции и соединили ее с решением для распознавания звука с помощью нейросетей.

Губной врач: нейросеть восстановит речь по артикуляции
Фото: Depositphotos

— Создаваемая нами программа будет оценивать изображение с видеокамеры, определяя, каким образом пациент устанавливает губы и язык при произношении какого-либо звука или слога, — рассказал декан факультета педагогики и психологии Педагогического института ВятГУ Вячеслав Утёмов. — Одновременно с этим она будет записывать и распознавать получившийся звук и сопоставлять его с заранее определенным идеальным образцом, оценивая качество речи.

По словам ученого, изначально программа будет настроена на контроль 12 проблемных звуков. Точность ее работы составит около 90%. Таких результатов разработчикам удалось добиться за счет использования нейросетей. Причем если для анализа звука подобных систем существует уже довольно много, то для контроля артикуляции разработчикам пришлось задействовать нестандартное решение.

— Для определения правильности положения губ и языка пациента мы используем нейронную сеть, которая изначально прошла обучение на большом массиве изображений из открытой базы и способна их классифицировать, — пояснил Вячеслав Утёмов. — Далее мы провели специализированное обучение системы на фотографиях, связанных с артикуляцией. Это позволило ее доработать под наши цели и добиться высокой точности.

Губной врач: нейросеть восстановит речь по артикуляции
Фото: Depositphotos

Таким образом, в условиях реального применения новая система искусственного интеллекта будет способна самостоятельно выбирать время для производства снимка, а после фиксации изображения проанализирует его, оценив правильность артикуляции.

Выводы о точности использованных нейросетей были сделаны после их тестирования на 8000 образцов, созданных с помощью алгоритмической обработки 300 реальных записей пациентов.

Спросить у зеркала

В реальной практике система будет показывать человеку правильную артикуляцию и проводить занятие по заранее составленной программе. После ее завершения она сможет составить аналитический отчет и отразить в нем все речевые проблемы пациента. Это позволит логопедам корректировать программу занятий для ускорения прогресса в лечении.

По мнению разработчиков, данный подход даст возможность значительно ускорить прогресс в исправлении звукопроизношения за счет проведения самостоятельных занятий с помощью смартфона или другого устройства, на которое может быть установлена программа.

Новую программу оценили специалисты Кировской областной клинической психиатрической больницы им. В.М. Бехтерева, которые собирали данные для обучения задействованных нейросетей.

Данная разработка, конечно, не сможет полностью заменить логопеда, особенно на стадии первичной диагностики, когда от специалиста требуется проявить индивидуальный подход к пациенту, чтобы назначить правильное лечение, — подчеркнула логопед больницы Валерия Караваева. — Однако она будет весьма полезна на этапе выполнения пациентом самостоятельной работы.

Губной врач: нейросеть восстановит речь по артикуляции
Фото: Depositphotos

Также эксперт подчеркнула, что на сегодняшний день создаваемая система является единственным русскоязычным решением, которое учитывает параметры артикуляции человека. Среди иностранных аналогов можно выделить китайское приложение, но его вряд ли можно адаптировать под европейские языки.

— Разработка действительно уникальна для России, однако нужно учитывать, что сейчас самостоятельные занятия пациенты проводят, глядя в зеркало, что позволяет им отслеживать свою артикуляцию, — отметила заведующая кафедрой логопедии Московского государственного областного университета Елена Шилова. — Поэтому телефон во время выполнения упражнений должен, помимо прочего, также показывать лицо. Именно визуальный самоконтроль способствует эффективной выработке правильных речевых рефлексов.

Ожидается, что представленная система пройдет клинические испытания на базе одной из больниц города Кирова уже в 2021 году.

Разработчики не исключают и других направлений возможного развития используемых в программе нейросетей. В частности, в будущем новая система искусственного интеллекта сможет распознавать речь человека по его артикуляции, записанной на видео, что может пригодиться, например, при расшифровке разговоров, полученных с камер наблюдения.

Читайте также
Прямой эфир