Какие события в сфере ИИ произошли за неделю
Сфера искусственного интеллекта продолжает набирать обороты: крупные технологические компании расширяют линейки моделей, делая акцент на персонализацию и специализированные отраслевые решения, а российские научные центры предлагают прикладные ИИ-инструменты для экологии и разработки ПО. «Известия» подготовили подборку ключевых событий в сфере ИИ за прошедшую неделю.
Google обновила медицинскую линейку MedGemma и представила MedASR
Компания Google объявила о выпуске MedGemma 1.5 — обновленной версии открытой медицинской генеративной модели, ориентированной на интерпретацию изображений и работу с клиническими данными. Обновление затронуло модель MedGemma 1.5 4B, которая получила расширенную поддержку высокоразмерных медицинских изображений, включая КТ, МРТ и цифровую гистопатологию, а также улучшенные возможности анализа серий рентгеновских снимков и локализации анатомических объектов.
По данным Google Research, точность классификации заболеваний на КТ выросла на 3%, на МРТ — на 14%, а качество интерпретации гистопатологических изображений приблизилось к специализированным моделям. Одновременно улучшены текстовые возможности модели: результаты на медицинских вопросно-ответных наборах MedQA и EHRQA выросли на 5% и 22% соответственно. MedGemma 1.5 доступна для исследований и коммерческого использования через Hugging Face и Vertex AI и может работать в офлайн-режиме.
Параллельно Google представила MedASR — открытую модель автоматического распознавания речи, оптимизированную для медицинской диктовки. В сравнении с универсальными ASR-решениями число ошибок при расшифровке медицинских диктовок снизилось более чем вдвое. В компании отмечают, что связка MedASR и MedGemma позволяет выстраивать полноценные голосовые сценарии для клинических задач, от заполнения документации до предварительного анализа данных.
Gemini получил бета-функцию персонализированных ответов на основе данных пользователя
Компания Google запустила в приложении Gemini новую бета-функцию Personal Intelligence, которая позволяет ИИ-ассистенту формировать упреждающие и персонализированные ответы на основе фотографий, электронных писем, истории поиска и просмотра видео пользователя. Речь идет о более глубокой работе с экосистемой Google — Gmail, Google Photos, Search — без необходимости вручную указывать источники информации.
Как пояснил вице-президент Google Labs и руководитель направления Gemini Джош Вудворд, ключевая особенность режима заключается в способности модели рассуждать на основе разнородных данных и связывать их между собой. В частности, Gemini может сопоставлять переписку, изображения и видеоконтент, чтобы предлагать рекомендации с учетом личного контекста пользователя — от планирования поездок до подбора покупок и развлечений.
В Google подчеркивают, что функция отключена по умолчанию и активируется только по инициативе пользователя. При этом данные из Gmail и Google Photos не используются для обучения модели и применяются исключительно для генерации конкретных ответов. В компании также отмечают наличие защитных ограничений для чувствительных тем, включая медицинскую информацию.
Российские ученые разработали ИИ для обнаружения мусора в Арктике
Ученые Московского физико-технического института (МФТИ) совместно с Институтом океанологии РАН разработали инновационную систему на базе технологии искусственного интеллекта (ИИ) для автоматического обнаружения мусора в арктических морях. Алгоритм анализирует изображения с камер, установленных на бортах судов, и по точности превосходит зарубежные аналоги.
По словам заведующего лабораторией машинного обучения в науках о Земле МФТИ Михаила Криницкого, система обучалась на массиве более чем из 500 тыс. фотографий, сделанных в Баренцевом и Карском морях. ИИ способен различать морской мусор, птиц, блики на воде и капли на объективе. Разработка особенно актуальна для Арктики, где антропогенные отходы практически не разлагаются из-за низких температур, а значительная часть загрязнений поступает с морскими течениями из других регионов мира.
Эксперты отмечают, что подобные решения могут стать основой для автоматизированного экологического мониторинга и оценки антропогенной нагрузки в труднодоступных районах.
В России программисты ускорили обучение ИИ-моделей на 40%
Ученые Научно-образовательного центра ФНС России совместно со специалистами МГТУ им. Н.Э. Баумана разработали автоматизированный сценарий настройки языковых моделей, позволяющий адаптировать ИИ под конкретные измеримые задачи без ручного подбора параметров. По данным разработчиков, подход сокращает число комплексных проверок примерно в 1,6 раза и ускоряет настройку на 40% без потери качества.
Доктор технических наук, ведущий научный сотрудник НОЦ ФНС России и МГТУ им. Н.Э. Баумана Игорь Масич рассказал «Известиям», что система автоматически формирует набор оптимальных конфигураций под разные сценарии — от максимальной скорости до приоритета точности. По его словам, это позволяет использовать решение как в промышленных ИИ-сервисах, так и в государственных и корпоративных проектах, где требования к надежности и эффективности особенно высоки.
Разработчики подчеркивают, что предложенный подход ориентирован на практическое применение и может упростить внедрение языковых моделей в прикладные ИТ-системы.
Все важные новости — в канале «Известия» в мессенджере МАХ