Минобрнауки берет пример с Apple и Google

И спешит создать собственную систему автоматического распознавания русской речи
Павел Панов
Фото: РИА НОВОСТИ/Григорий Сысоев

Вслед за появлением популярных международных сервисов по распознаванию устной речи у американских компаний Apple и Google аналогичный сервис может появиться и для распознавания русской речи. Министерство образования и науки решило выделить до 30 млн рублей на проведение научно-исследовательских работ в этом направлении.

Разработчик программного приложения будет определен по итогам открытого конкурса, объявленного Минобрнауки на прошлой неделе. Уровень новой разработки по научным, технологическим и инженерным критериям должен опередить все известные продукты основных конкурентов, расчитывают в ведомстве.

Чиновники поясняют инициативу тем, что русский язык не приоритетен для мировых разработчиков. При этом в 2011 году объем мирового рынка устройств с использованием систем распознавания речи, по данным Минобрнауки, составил $38 млрд.

Новая система должна будет способна распознавать не менее 10 различных диалектов русского языка, включая произношение жителей Кавказа, Поволжья и азиатской части страны. Экспериментальный образец должен будет понимать и смешанные фразы, например: «Найти песню группы Rolling Stones», для чего систему научат понимать и английский язык.

Запрос пользователя может быть осуществлен в виде вопросительного или повествовательного предложения, а также в виде набора ключевых слов. Общая длина запроса не должна будет превышать 512 символов, качество распознавания надиктованной речи должно быть не ниже 80% всего текста. Российская разработка должна будет адаптироваться к новым словам из любой предметной области за счет постоянного пополнения морфологического словаря.

Новый сервис, в отличие от Google Voice, должен будет способен работать, по замыслу заказчика, не только при помощи связи с сервером через интернет, но и в режиме офлайн. Правда, во втором случае распознавание речи будет менее точным из-за ограниченного словарного запаса, хранящегося непосредственно на компьютере.

Эксперты скептически восприняли намерения Минобрнауки разработать собственный сервис, напоминая, что даже международные компании редко позволяют себе начинать проекты в новых для них областях с нуля.

— Для речевого перевода поисковых запросов лучше использовать уже существующие специализированные системы распознавания речи, — говорит Сергей Юцайтис, инженер компании Cisco. — Целесообразность создания собственного продукта оправдана в случаях, когда его планируют использовать в областях жизнедеятельности, требующих максимально точного функционирования, или, например, в интересах государства.

Сомнения в возможности создать собственную систему анализа речи за указанные деньги высказал директор IT-кластера Сколково Александр Туркот:

— В моем понимании это невозможно. Думаю, что они скорее всего возьмут чью-то уже готовую систему и адаптируют ее под свои нужды. Причем они могут даже не покупать какие-то технологии, а просто лицензировать данную систему, — отметил Туркот.

Коммерциализация разработки резко поднимет эффективность промышленного производства в целом, заявили «Известиям» в Минобрнауки. Появятся бесклавиатурные компьютеры, телефоны, бытовая техника, системы стенографирования и регистрации потоков речевой информации. Также продукт может применяться в системах смыслового поиска и анализа речевой и текстовой информации, системах автоматического перевода речевой информации для различных языков, медицинских системах для людей с нарушениями опорно-двигательного аппарата.