Перейти к основному содержанию
Реклама
Прямой эфир
Мир
WP сообщила об угрозах США раскрыть случаи коррупции на Украине
Мир
В минобороны Канады сообщили о планах увеличить военное присутствие в Арктике
Мир
В Совфеде назвали обращение Макрона местью за холодный прием у Трампа
Мир
NYT узнала о плане администрации Трампа запретить въезд в США гражданам ряда стран
Мир
Орбан указал на мировую изоляцию Евросоюза
Общество
Завершились работы по разделке кормы танкера «Волгонефть-239»
Мир
СМИ сообщили о предложении торговой палаты США снять часть санкций с РФ
Общество
Синоптики спрогнозировали небольшой дождь в Москве 7 марта
Армия
ВС РФ ночью нанесли удар по обеспечивающей работу ВПК Украины инфраструктуре
Мир
Трамп призвал уволить пренебрегающих обязанностями чиновников
Армия
«Рособоронэкспорт» сообщил о возможном скором начале производства Су-57Э в Индии
Наука и техника
В РФ создали прототип транзистора для перспективной силовой электроники
Общество
Организатора финансирования терроризма выявила ФСБ в Томской области
Общество
СК возбудил дело по факту убийства боевиками ВФУ двух жителей курских Погребков
Мир
Южнокорейский суд отменил ордер на арест президента Юн Сок Ёля
Мир
Глава МАГАТЭ заявил о размывании норм на фоне заявления Макрона о ядерном оружии
Мир
Бомбардировщики США B-52 впервые сбросили бомбы на полигон в Финляндии

Новая разработка «Яндекса» ускорит обучение нейросетей

199
Фото: ИЗВЕСТИЯ/Константин Кокошкин
Выделить главное
Вкл
Выкл

«Яндекс» разработал библиотеку YaFSDP, предназначенную для ускорения обучения больших языковых моделей. Как сообщается в пресс-релизе компании, сервис уже доступен для разработчиков.

Библиотека подходит для обучения всех языковых моделей, включая модели с открытым исходным кодом. В компании также отметили, что она применима и для нейросетей, генерирующих изображения. YaFSDP позволяет сократить время обучения до 25% в зависимости от параметров и архитектуры модели. Кроме того, она позволяет снизить потребление ресурсов графических процессоров (GPU) до 20%.

Как пояснили в компании, одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Читайте также
Прямой эфир
Следующая новость
На нашем сайте используются cookie-файлы. Продолжая пользоваться данным сайтом, вы подтверждаете свое согласие на использование файлов cookie в соответствии с настоящим уведомлением и Пользовательским соглашением