Нейросеть Kandinsky 2.1 от Сбера: Как пользоваться онлайн бесплатно без регистрации
Нейросеть Kandinsky 2.1 от Сбера: Как пользоваться
Опубликовано:
Комментариев:0

Нейросеть Kandinsky 2.1 от Сбера: Как пользоваться

Поделиться:

Нейросеть Kandinsky 2.1 от Сбера: Как пользоваться

Сбер представил обновленную версию своей нейросети, известной как Kandinsky 2.1, которая способна генерировать изображения на основе текстовых запросов.

Одной из ключевых особенностей сервиса является его работа с русским языком. Пользователи могут описывать изображение, указывать желаемый стиль и уточнять детали. В отличие от большинства подобных сервисов, Kandinsky 2.1 хорошо понимает русскоязычные запросы и учитывает их при генерации изображений.

Давайте рассмотрим, почему стоит обратить внимание на эту нейросеть и в чем заключаются ее преимущества по сравнению с основным конкурентом.

Нейросеть Kandinsky 2.1 от Сбера: Как пользоваться
Девушка на пляже с помощью нейросети Kandinsky.

Где попробовать нейросеть Kandinsky 2.1

Есть несколько способов:

  1. На сайте fusionbrain.ai — это тестовый сайт команды «Кандинского». Там можно генерировать на основе текста и использовать режим дорисовки.
  2. В официальном телеграм-боте — там доступны все четыре режима генерации.
  3. На сайте Rudalle — так называлась самая первая версия нейросети Сбера для генерации картинок.
  4. С помощью навыка «Включи художника» в голосовом помощнике «Салют» от Сбера.

Во всех четырех случаях нейросеть может не сработать. Регулярно появляются ошибки и на сайтах, и в телеграм-боте. Сбер объясняет это большой нагрузкой на сервис.

Что собой представляет Kandinsky 2.1

Летом 2022 года Сбер представил Kandinsky 2.1 — новое поколение своей нейросети для генерации изображений. В результате значительных улучшений и обучения на 170 миллионах пар «текст-изображение», модель Kandinsky 2.1 содержит 3,3 миллиарда параметров, превосходя предыдущую версию, Kandinsky 2.0, которая имела только 2 миллиарда. Подробности о технической стороне проекта доступны в блоге компании на платформе «Хабр».

Принцип работы этой нейросети аналогичен другим конкурентам — она создает изображения в различных стилях на основе текстового запроса. Однако разработчики Kandinsky 2.1 гордятся тем, что они поддерживают более 100 языков, включая русский, в то время как англоязычные сервисы Midjourney или Dall-e 2 не могут похвастаться такой функциональностью. Это значительное преимущество, которое отличает эту нейросеть от остальных, требующих от пользователей знания английского языка или использование переводчика.

Нейросеть Сбера предлагает четыре основных режима работы:

  1. Генерация на основе текста: эта функция требует текстовый запрос, и на его основе нейросеть создает соответствующее изображение.
  2. Смешение изображений: возможность добавить два изображения и увидеть результат их смешения, созданного нейронной сетью.
  3. Вариации изображения: при наличии существующего изображения или фотографии, применяя определенный стиль, можно получить новую вариацию этого изображения.

Перекраска: этот режим позволяет изменить цвета фотографии или изображения, а затем попросить нейронную сеть дополнить его, дорисовав необходимые детали, которых может не хватать на изначальном снимке.

Нейросеть Kandinsky 2.1 от Сбера: Как пользоваться

Как использовать генерацию картинок в Kandinsky 2.1

Есть два хороших варианта: использование телеграм-бота или fusionbrain.ai, который представляет собой полноценный сайт для генерации изображений. На сайте есть область, где появится текстовое поле для запроса и выбора основных стилей.

Область выделения выделена фиолетовым квадратом, ее размеры можно изменить. Это не особенно полезно при создании по тексту, но может быть полезно при других режимах.

Сейчас используются более 20 стилей, включая привычные киберпанк или аниме, а также новые для нейросетевых сервисов, такие как советские мультфильмы и хохлома. В русскоязычных приложениях обычно проблематично сгенерировать что-то вроде, так как модели не обучались на таких изображениях.

Вот полный список стилей:

  1. Аниме.
  2. Детальное фото.
  3. Киберпанк.
  4. Кандинский.
  5. Айвазовский.
  6. Малевич.
  7. Пикассо.
  8. Гончарова.
  9. Классицизм.
  10. Ренессанс.
  11. Картина маслом.
  12. Рисунок карандашом.
  13. Цифровая живопись.
  14. Средневековый стиль.
  15. Советский мультфильм.
  16. 3D-рендер.
  17. Мультфильм.
  18. Студийное фото.
  19. Портретное фото.
  20. Мозаика.
  21. Иконопись.
  22. Хохлома.
  23. Новый год.

Большинство стилей работают хорошо, но фирменные стили не всегда очень похожи на создание результатов, например, советского мультфильма или хохломы, которые могут не удаться. Однако в текстовом запросе можно самостоятельно добавить стилистику, которой нет в списке, о размещении галочки в точке «Без стиля».

Все изображения генерируются в разрешении 768 × 768 точек. Более высокое разрешение может быть установлено, хотя современные нейросети уже рисуют более качественные картинки.

Редактирование изображений — это функция, которая позволяет изменять уже сгенерированную картинку с помощью инструмента «ластик». При необходимости можно изменить любую часть изображения, а затем использовать параметр «Создать» для получения нового результата. Это очень полезный инструмент, который не предоставляется во многих сервисах.

Еще один полезный инструмент, который не доступен во многих сервисах — это дорисовка. Нужно сгенерировать или загрузить картинку, чтобы уменьшить ее, чтобы получить большее поле для генерации. После этого можно добавить текстовый запрос или выбрать стиль, и нейросеть «дорисует» картинку.

Нейросеть Kandinsky 2.1 от Сбера: Как пользоваться

Сравнивая Kandinsky 2.1 и Midjourney

В процессе использования Kandinsky 2.1, я неоднократно замечал, что его стилистические результаты напоминают популярную нейросеть Midjourney, особенно версии v3 и v4, а не их пятое поколение, которое сосредоточено на реализме. Это вдохновило меня сравнить оба сервиса непосредственно. В случае с Kandinsky 2.1, я формулировал запросы на русском языке, а затем переводил их на английский и использовал в Midjourney.

В итоге, я пришел к выводу, что Midjourney, конечно, генерирует картинки высокого качества и лучше работает с деталями. Однако, Kandinsky 2.1 не отстает слишком сильно, особенно если не вдаваться в мельчайшие детали изображений. Он стилистически создает схожие изображения. Большим преимуществом является то, что Kandinsky 2.1 полностью бесплатный, в отличие от Midjourney.

Таким образом, обе нейросети имеют свои преимущества и подходят для различных потребностей.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Новости