ruDALL-E - Скачать для фотошопа и сайта

Регистрация Вход

Главная сайта

Форум Все для фотошопа и сайта

Страница 1 из 1
1

ruDALL-E (семейство генеративных моделей от SberDevices и Sber AI)

ruDALL-E

diamont1977 Контакты diamont1977

Дата: Понедельник, 08.01.2024, 03:15 | Сообщение # 1

Администраторы

Сообщений:: 1542

Замечания:: 0

Offline

ruDALL-E

ruDALL-E – семейство генеративных моделей от SberDevices и Sber AI

Представляем семейство генеративных моделей от SberDevices и Sber AI!
Содержание показать
Модели позволяют создавать изображения, которых раньше не существовало. Всё что нужно — текстовое описание на русском или другом языке.

Ниже — технические характеристики каждой из моделей, а также примеры созданных ими изображений.

Попробуйте вместе с генеративными художниками создать уникальные изображения, используя свои собственные формулировки. Попросите генеративных художников изобразить что-то особенное и для вас.

Kandinsky 3.0
Kandinsky 3.0 обладает новой архитектурой, что привело к заметному повышению качества генераций. Для обучения нейросети использовался обновленный датасет в размере 1,5 млрд пар «текст — изображение». Kandinsky 3.0 понимает запросы более чем на 100 языках, а пользователи могут создавать изображения в неограниченном количестве стилей с разным соотношением сторон. Глобальное отличие версии модели 3.0 от предыдущих состоит в замене текстового CLIP Encoder на энкодерную часть модели Flan-UL2 и замене в архитектуре U-Net стандартных свёрточных блоков из StableDiffusion на блоки BigGAN.

Kandinsky 3.0 обладает новой архитектурой, что привело к заметному повышению качества генераций.
Kandinsky Video
Kandinsky Video — это первая в России нейросеть, способная генерировать видеоролики по текстовому описанию. Архитектура Kandinsky Video состоит из двух ключевых блоков: первый отвечает за создание ключевых кадров, из которых складывается структура сюжета видео, а второй — за генерацию интерполяционных кадров, которые позволяют достичь плавности движений в финальном видео. Нейросеть создаёт видеоролики с разрешением 512 х 512 пикселей и различным соотношением сторон, длительностью до 8 секунд. Генерация занимает до трёх минут. Модель обучена на датасете из более чем 300 тыс. пар «текст — видео».

Kandinsky Video — это первая в России нейросеть, способная генерировать видеоролики по текстовому описанию.
Kandinsky 2.2 Генеративные анимации
Модель Kandinsky 2.2 позволяет создавать анимационные видеоролики с частотой 24 кадра в секунду и разрешением 640×640 пикселей на основе одного или нескольких текстовых запросов. На каждый запрос генерируется 4-х секундный фрагмент видео, при этом синтез 1 секунды видео в среднем занимает около 20 секунд. При создании ролика доступно 16 вариантов анимации сцены: движение влево, вправо, по кругу, бесконечное приближение и удаление и многие другие режимы. В основе всех режимов анимации лежит функция перерисовки изображения по текстовому описанию.

Модель Kandinsky 2.2 позволяет создавать анимационные видеоролики с частотой 24 кадра в секунду и разрешением 640x640 пикселей на основе одного или нескольких текстовых запросов.
Kandinsky 2.2
Модель Kandinsky 2.2 позволяет создавать изображения более высокого разрешения — до 1024 пикселей — с различным соотношением сторон, а получающиеся результаты обладают высокой степенью фотореалистичности. Архитектурно Kandinsky 2.2 не отличается от версии 2.1, но за счёт увеличения энкодера изображений для Image prior модели до версии CLIP-g удалось повысить качество генераций. Также в рамках общей архитектуры мы перестали передавать текстовые эмбеддинги в диффузионную модель UNet.

Модель Kandinsky 2.2 позволяет создавать изображения более высокого разрешения — до 1024 пикселей — с различным соотношением сторон, а получающиеся результаты обладают высокой степенью фотореалистичности.
Kandinsky 2.1
Модель Kandinsky 2.1 построена на обратной латентной диффузии, а специальный image prior блок вместе с новым декодером изображений позволяют добиться впечатляющего качества. Kandinsky 2.1 разработана исследователями команды Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и SberDevices.

Модель Kandinsky 2.1 построена на обратной латентной диффузии, а специальный image prior блок вместе с новым декодером изображений позволяют добиться впечатляющего качества.
ruDALL-E Kandinsky (XXL)
Русская text-to-image модель, генерирующая изображения по тексту. Архитектура такая же, как у ruDALL-E XL. Ещё больше параметров в новой версии!

Русская text-to-image модель, генерирующая изображения по тексту. Архитектура такая же, как у ruDALL-E XL. Ещё больше параметров в новой версии!
ruDALL-E Malevich (XL)
По короткому текстовому описанию ruDALL-E генерирует яркие и красочные изображения на самые разные темы и сюжеты. Модель понимает обширный набор понятий и генерирует совершенно новые изображения и объекты, которых не существовало в реальном мире.

По короткому текстовому описанию ruDALL-E генерирует яркие и красочные изображения на самые разные темы и сюжеты.
ruDALL-E Emojich
По короткому текстовому описанию ruDALL-E генерирует смайлики, которые можно использовать для стикеров, клипартов и прототипов дизайна. Модель понимает обширный набор понятий и генерирует совершенно новые эмодзи, которых не существовало до этого.

По короткому текстовому описанию ruDALL-E генерирует смайлики, которые можно использовать для стикеров, клипартов и прототипов дизайна.

Скачать ruDALL-E

Прикрепления: 0716887.png (449.0 Kb)

ruDALL-E (семейство генеративных моделей от SberDevices и Sber AI)

Страница 1 из 1
1