Перейти к основному содержанию
Реклама
Прямой эфир
Общество
В Хакасии и Челябинской области возбуждены дела по факту нарушений при строительстве
Общество
Глава СК затребовал доклад после жалобы жительницы Ленобласти Путину
Интернет и технологии
В России не будут запрещать иностранные платформы искусственного интеллекта
Общество
Путин пообещал решить проблему с выплатами участникам СВО
Экономика
Набиуллина заявила о выходе экономики РФ из состояния перегрева в 2026 году
Общество
«Итоги года» с Владимиром Путиным продлились около 4,5 часов
Общество
Мэр Люберец пообещал развивать общепит после прямой линии с Путиным
Пресс-релизы
В РФ завершена полевая апробация инструмента для оценки цифровой безопасности
Общество
Рост цен на авиабилеты в России связан с недостатком авиационного парка
Авто
Аналитики указали на снижение популярности новых пикапов в России
Общество
Путин не считает поколение 90-х потерянным
Мир
Зеленский признал неуязвимость ракеты «Орешник»
Новости компаний
В «Ингосстрахе» напомнили о необходимости страхования в турпоездках
Мир
Bloomberg указало на неготовность НАТО к затяжному конфликту
Общество
Президент РФ подчеркнул важность книг для формирования мировоззрения детей
Общество
Девочка предложила заменить журналиста Павла Зарубина в его же передаче
Спорт
Вратарь ПСЖ Сафонов сломал руку в финале Межконтинентального кубка

Новая разработка «Яндекса» ускорит обучение нейросетей

0
Фото: ИЗВЕСТИЯ/Константин Кокошкин
Озвучить текст
Выделить главное
Вкл
Выкл

«Яндекс» разработал библиотеку YaFSDP, предназначенную для ускорения обучения больших языковых моделей. Как сообщается в пресс-релизе компании, сервис уже доступен для разработчиков.

Библиотека подходит для обучения всех языковых моделей, включая модели с открытым исходным кодом. В компании также отметили, что она применима и для нейросетей, генерирующих изображения. YaFSDP позволяет сократить время обучения до 25% в зависимости от параметров и архитектуры модели. Кроме того, она позволяет снизить потребление ресурсов графических процессоров (GPU) до 20%.

Как пояснили в компании, одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Читайте также
Прямой эфир