В России представлена нейросеть Kandinsky 2.1
«Сбер» представил нейросеть Kandinsky 2.1, которая может за несколько секунд создавать высококачественные изображения по текстовому описанию. Об этом говорится в сообщении пресс-службы банка.
Отмечается, что нейросеть также может смешивать несколько рисунков, генерировать изображения, похожие на заданное, дорисовывать недостающие части и формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
Модель понимает запросы на 101 языке и владеет разными техниками рисования. Нейросеть находится в открытом доступе, ее можно бесплатно протестировать.
Первый зампред правления Сбербанка Александр Ведяхин рассказал, что во время разработки Kandinsky 2.1 специалисты учитывали мнения пользователей и изучали передовые концепции. «В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это ещё один важный шаг к AGI — сильному искусственному интеллекту», — отметил Ведяхин.
В отличие от предыдущей версии, новая модель Kandinsky 2.1 была дополнительно обучена на отдельно собранном датасете из 2 млн пар качественных изображений. В данный сет попали картинки с описаниями в сложных для нейросетей областях — это тексты и лица людей.
«Нейросеть также была усовершенствована за счет новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0», — рассказали в пресс-службе «Сбера».
Указывается также, что модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере ее можно использовать для создания персонализированных маркетинговых решений.