Ru En
Kandinsky 2.2: «Сбер» обновил нейросеть для генерации изображений

Kandinsky 2.2: «Сбер» обновил нейросеть для генерации изображений

13.07.2023

«Сбер» представил новую версию нейросети для генерации изображений — Kandinsky 2.2.

Что такое нейросеть Kandinsky 2.2

Kandinsky 2.2 — это обновленная версия нейросети Kandinsky 2.1, которую «Сбер» выпустил в апреле. Нейросеть умеет генерировать изображения по запросу пользователя. Kandinsky 2.2, как ее предшественники и аналоги, работает на основе диффузионной модели, которая сначала размывает изображение, а потом пытается его восстановить, создавая в итоге новое.

Возможности нейросети Kandinsky 2.2

Kandinsky 2.2 так же, как и Kandinsky 2.1, умеет генерировать изображения по текстовому запросу в 21 стиле, смешивать несколько картинок, смешивать картинки и текст, делать вариации уже готовых изображений.

Среди новых возможностей нейросети:

  • разное соотношение сторон. Раньше картинку можно было генерировать только в формате 1:1. Теперь появились — 16:9 (1024х576 пикселей), 9:16 (576х1024), 3:2 (1024х680) и 2:3 (680х1024);

  • генерация фотореалистичных изображений с более высоким качеством;

  • генерация стикеров;

  • структурный блок ControlNet, который позволяет менять только часть изображения, сохраняя исходную композицию.

Как пользоваться нейросетью Kandinsky 2.2

Воспользоваться нейросетью можно бесплатно в нескольких источниках:

Чтобы сгенерировать картинку, нужно написать запрос (промпт). На сайте «Сбера» приводится самая простая формула — объект + фон + стиль. Кроме того, промпт должен быть как можно более детальным и содержать в описании конкретные предметы, а не абстрактные понятия.


Kandinsky 2.2: «Сбер» обновил нейросеть для генерации изображений