Перейти к основному содержанию
Реклама
Прямой эфир
Мир
Трамп провел переговоры с Зеленским в США. Главное
Мир
Трамп опроверг обвинения в обстреле Запорожской АЭС Россией
Мир
Фон дер Ляйен указала на прогресс по итогам видеоконференции с Трампом и Зеленским
Армия
Средства ПВО за три часа уничтожили 21 БПЛА над регионами России
Мир
Трамп рассказал об обсуждении с Путиным времени и места новой встречи
Культура
Министр культуры оценила инициативу по маркировке ИИ-контента
Мир
Трамп указал на большие возможности от возобновления торговых отношений с РФ
Мир
Посол КНР в РФ рассказал о растущем интересе к российскому рынку
Мир
Трамп сообщил о неурегулированных сложных вопросах соглашения по Украине
Мир
В возрасте 83 лет умер бывший гендиректор IBM Луис Герстнер
Мир
Трамп назвал телефонный разговор с Путиным «отличным»
Общество
В России началась самая короткая рабочая неделя года
Мир
Трамп допустил проведение Украиной референдума для решения вопроса урегулирования
Мир
Трамп назвал свою резиденцию Мар-а-Лаго подходящим местом для заключения сделок
Культура
Ольга Любимова заявила об интересе к системе продажи билетов в театры по паспорту
Мир
Дмитриев назвал советы Стармера делом личного риска
Мир
Зеленский вновь отказался от строгого дресс-кода на встрече с Трампом

В рейтинг качества ответов нейросетей попала новая разработка «Яндекса»

0
Фото: ИЗВЕСТИЯ/Дмитрий Коротаев
Озвучить текст
Выделить главное
Вкл
Выкл

Нейросеть YandexGPT Experimental вошла в новый рейтинг Llmarena, который оценивает качество ответов генеративных моделей на русском языке.

В топ также включили GPT-4o, LLaMA 3.1 и Claude 3,5 Sonnet.

«Яндекс» подтвердил, что ведет работу над новой более мощной версией своей базовой языковой модели.

Рейтинг оценивает, насколько хорошо модели отвечают на вопросы на русском языке. Пользователи могут задавать их на «Арене» и сравнивать, какая из нейросетей ответила лучше. Ответы выдаются без привязки к конкретной нейросети, чтобы пользователь мог беспристрастно оценить их качество. На основе собранных оценок авторы сервиса строят лидерборд моделей.

«Арену» запустили разработчики из российского ML-комьюнити. Принцип работы был взят у зарубежного сервиса LMSYS Chatbot Arena — одного из самых авторитетных бенчмарков на зарубежном рынке.

Читайте также
Прямой эфир