Реклама

Прямой эфир

Трамп провел переговоры с Зеленским в США. Главное

Трамп опроверг обвинения в обстреле Запорожской АЭС Россией

Фон дер Ляйен указала на прогресс по итогам видеоконференции с Трампом и Зеленским

Средства ПВО за три часа уничтожили 21 БПЛА над регионами России

Трамп рассказал об обсуждении с Путиным времени и места новой встречи

Культура

Министр культуры оценила инициативу по маркировке ИИ-контента

Трамп указал на большие возможности от возобновления торговых отношений с РФ

Посол КНР в РФ рассказал о растущем интересе к российскому рынку

Трамп сообщил о неурегулированных сложных вопросах соглашения по Украине

В возрасте 83 лет умер бывший гендиректор IBM Луис Герстнер

Трамп назвал телефонный разговор с Путиным «отличным»

Общество

В России началась самая короткая рабочая неделя года

Трамп допустил проведение Украиной референдума для решения вопроса урегулирования

Трамп назвал свою резиденцию Мар-а-Лаго подходящим местом для заключения сделок

Культура

Ольга Любимова заявила об интересе к системе продажи билетов в театры по паспорту

Дмитриев назвал советы Стармера делом личного риска

Зеленский вновь отказался от строгого дресс-кода на встрече с Трампом

В рейтинг качества ответов нейросетей попала новая разработка «Яндекса»

30 июля 2024, 19:55

0

Нейросеть

Фото: ИЗВЕСТИЯ/Дмитрий Коротаев

dzen

dzen

Следите за нашими новостями в удобном формате

fos

Есть новость? Присылайте!

Озвучить текст

Выделить главное

Вкл

Выкл

Нейросеть YandexGPT Experimental вошла в новый рейтинг Llmarena, который оценивает качество ответов генеративных моделей на русском языке.

В топ также включили GPT-4o, LLaMA 3.1 и Claude 3,5 Sonnet.

«Яндекс» подтвердил, что ведет работу над новой более мощной версией своей базовой языковой модели.

Рейтинг оценивает, насколько хорошо модели отвечают на вопросы на русском языке. Пользователи могут задавать их на «Арене» и сравнивать, какая из нейросетей ответила лучше. Ответы выдаются без привязки к конкретной нейросети, чтобы пользователь мог беспристрастно оценить их качество. На основе собранных оценок авторы сервиса строят лидерборд моделей.

«Арену» запустили разработчики из российского ML-комьюнити. Принцип работы был взят у зарубежного сервиса LMSYS Chatbot Arena — одного из самых авторитетных бенчмарков на зарубежном рынке.

Поделиться:

Читайте также

Прямой эфир

Подпишитесь и получайте новости первыми

Меню

Авторское право на систему визуализации содержимого портала iz.ru, а также на исходные данные, включая тексты, фотографии, аудио- и видеоматериалы, графические изображения, иные произведения и товарные знаки принадлежит ООО «МИЦ «Известия». Указанная информация охраняется в соответствии с законодательством РФ и международными соглашениями.

Частичное цитирование возможно только при условии гиперссылки на iz.ru

Сайт функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

Ответственность за содержание любых рекламных материалов, размещенных на портале, несет рекламодатель.

На информационном ресурсе применяются рекомендательные технологии. Подробнее

Новости, аналитика, прогнозы и другие материалы, представленные на данном сайте, не являются офертой или рекомендацией к покупке или продаже каких-либо активов.

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций. Свидетельства о регистрации ЭЛ №ФС 77 - 76208 от 8 июля 2019 года , ЭЛ №ФС 77 - 72003 от 26 декабря 2017 года

Все права защищены © ООО «МИЦ «Известия», 2025