Перейти к основному содержанию
Реклама
Прямой эфир
Мир
Миссия Ирана при ООН заявила об ответе на любой акт агрессии
Мир
Трамп заявил о завершении формирования состава «Совета мира»
Мир
WSJ сообщила об оттягивании США времени для перемещения сил на Ближний Восток
Мир
Британия поддержала создание миссии НАТО «Арктический часовой» в Гренландии
Мир
Китай призвал США отказаться от идеи применения военной силы в Иране
Мир
Тимошенко пожаловалась на блокировку счетов до решения суда
Мир
Небензя заявил о спаде протестной динамики и нормализации обстановки в Иране
Мир
The Guardian назвала подтолкнувшего Трампа к покупке Гренландии человека
Общество
Россиянам рассказали о возможности единовременной выплаты накопительной пенсии
Мир
Постпред РФ при ООН заявил о разжигании истерии США вокруг Ирана
Мир
Мачадо заявила о вручении президенту США Нобелевской премии мира
Происшествия
Оперштаб сообщил о работе ПВО в небе над Курском
Мир
В посольстве РФ раскрыли планы по сотрудничеству с Венесуэлой
Общество
Умер бывший игрок ФК «Динамо» Дмитрий Акимов
Мир
Постпред США при ООН заявил о сохранении всех вариантов в отношении Ирана
Мир
Родригес заявила о праве Венесуэлы на отношения с КНР, Россией, Кубой и Ираном
Мир
Белый дом сообщил о намерении Трампа обсудить с Мачадо ситуацию в Венесуэле

Новая разработка «Яндекса» ускорит обучение нейросетей

0
Фото: ИЗВЕСТИЯ/Константин Кокошкин
Озвучить текст
Выделить главное
Вкл
Выкл

«Яндекс» разработал библиотеку YaFSDP, предназначенную для ускорения обучения больших языковых моделей. Как сообщается в пресс-релизе компании, сервис уже доступен для разработчиков.

Библиотека подходит для обучения всех языковых моделей, включая модели с открытым исходным кодом. В компании также отметили, что она применима и для нейросетей, генерирующих изображения. YaFSDP позволяет сократить время обучения до 25% в зависимости от параметров и архитектуры модели. Кроме того, она позволяет снизить потребление ресурсов графических процессоров (GPU) до 20%.

Как пояснили в компании, одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Читайте также
Прямой эфир