Перейти к основному содержанию
Реклама
Прямой эфир
Политика
Песков заявил о неизменности целей СВО
Политика
Лавров назвал чистосердечным признанием слова Борреля о войне Европы против РФ
Мир
В Кремле призвали к сдержанности на фоне эскалации между Ираном и Израилем
Общество
Снежная буря накрыла Петербург и Ленинградскую область
Мир
Еврокомиссар по сельскому хозяйству назвал возможные меры поддержки фермеров
Происшествия
ФСБ задержала причастного к распространению вредоносного ПО в Telegram
Армия
ВС РФ за неделю уничтожили три МиГ-29 и четыре Ан-26 ВСУ
Общество
В Москве коммунальные службы перевели в режим повышенной готовности из-за грозы
Политика
Путин намерен провести переговоры с Алиевым 22 апреля
Мир
В США начали шутить над конгрессвумен Грин за попытки заблокировать помощь Киеву
Общество
Законопроект о передаче земли утратившим жилье при паводке принят в Оренбуржье
Мир
В Алжире активисты выступили против открытия KFC из-за поддержки Израиля
Мир
Проблемой детей украинских беженцев в Латвии назвали незнание родного языка
Общество
Бывших министров туризма Ставропольского края обвинили в организации преступного сообщества
Мир
В Кремле указали на индивидуальный характер ограничений поездок чиновников за рубеж
Общество
Глава МЧС России назвал напряженной паводковую ситуацию в Курганской области

Соцсеть «ВКонтакте» представила новые возможности алгоритмов

0
Фото: РИА Новости/Кирилл Каллиников
Озвучить текст
Выделить главное
вкл
выкл

«ВКонтакте» усовершенствовала технологию распознавания голосовых сообщений. Теперь всего за секунду можно расшифровать записи продолжительностью до двух минут — это 99% всех аудио, которые отправляют пользователи. А в тех случаях, когда хочется рассказать длинную историю, можно записать голосовое длительностью до часа.

Голосовые сообщения продолжают оставаться самым популярным типом вложений в мессенджере «ВКонтакте», обгоняя, например, фотографии и файлы. ВK запустила технологию распознавания в июне. С этого момента аудитория, которая пользуется голосовыми, выросла на 10% — сейчас она составляет 33 млн человек в месяц. В среднем каждый пользователь сервиса читает восемь расшифровок в день.

Технология распознавания аудиосообщений — собственная разработка команды «ВКонтакте». Чтобы переводить в текст более продолжительные записи, не жертвуя скоростью, разработчики нашли новое технологическое решение. Алгоритмы автоматически разбивают длинное аудио на короткие блоки, расшифровывают их все одновременно, а затем объединяют обратно в одно сообщение. При этом они умеют разделять запись, не разбивая слова на части, чтобы не искажать смысл сказанного, — для этого используется технология Voice Activity Detection. На распознавание сообщения уходит около секунды.

Сергей Ларионенко, старший разработчик команды Core Infrastructure «ВКонтакте»:

— Технология распознавания аудио помогает любителям и ненавистникам голосовых сообщений общаться друг с другом в удобном формате, а еще экономит время — прочитать расшифровку можно быстрее, чем прослушать аудио. Наше решение состоит из нескольких нейросетей, выдерживает высокую нагрузку, понимает русскоязычный сленг и показывает хорошие результаты даже при сложных условиях записи — например, посторонних шумах или скомканной речи. Мы продолжим развивать технологию, увеличивать скорость ее работы и улучшать качество распознавания.

Распознавание голосовых сообщений полностью автоматизировано. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers.

Ранее «ВКонтакте» преобразовала раздел «Сообщения» в «Мессенджер»: к звонкам и чатам добавилась возможность написать человеку по номеру телефона. В мессенджере можно не только переписываться, но и бесплатно устраивать групповые видеозвонки на 128 человек: ограничений по длительности нет, присоединиться к разговору можно анонимно даже без профиля в соцсети, для работы или учебных задач доступна демонстрация экрана, а пользоваться сервисом можно на любом устройстве.

Прямой эфир