|
Скачать для фотошопа и сайта Нейросети на все случаи жизни Скачать Нейросети ruDALL-E (семейство генеративных моделей от SberDevices и Sber AI) |
ruDALL-E |
Дата: Понедельник, 08.01.2024, 03:15 | Сообщение # 1
ruDALL-E
ruDALL-E – семейство генеративных моделей от SberDevices и Sber AI Представляем семейство генеративных моделей от SberDevices и Sber AI! Содержание показать Модели позволяют создавать изображения, которых раньше не существовало. Всё что нужно — текстовое описание на русском или другом языке. Ниже — технические характеристики каждой из моделей, а также примеры созданных ими изображений. Попробуйте вместе с генеративными художниками создать уникальные изображения, используя свои собственные формулировки. Попросите генеративных художников изобразить что-то особенное и для вас. Kandinsky 3.0 Kandinsky 3.0 обладает новой архитектурой, что привело к заметному повышению качества генераций. Для обучения нейросети использовался обновленный датасет в размере 1,5 млрд пар «текст — изображение». Kandinsky 3.0 понимает запросы более чем на 100 языках, а пользователи могут создавать изображения в неограниченном количестве стилей с разным соотношением сторон. Глобальное отличие версии модели 3.0 от предыдущих состоит в замене текстового CLIP Encoder на энкодерную часть модели Flan-UL2 и замене в архитектуре U-Net стандартных свёрточных блоков из StableDiffusion на блоки BigGAN. Kandinsky 3.0 обладает новой архитектурой, что привело к заметному повышению качества генераций. Kandinsky Video Kandinsky Video — это первая в России нейросеть, способная генерировать видеоролики по текстовому описанию. Архитектура Kandinsky Video состоит из двух ключевых блоков: первый отвечает за создание ключевых кадров, из которых складывается структура сюжета видео, а второй — за генерацию интерполяционных кадров, которые позволяют достичь плавности движений в финальном видео. Нейросеть создаёт видеоролики с разрешением 512 х 512 пикселей и различным соотношением сторон, длительностью до 8 секунд. Генерация занимает до трёх минут. Модель обучена на датасете из более чем 300 тыс. пар «текст — видео». Kandinsky Video — это первая в России нейросеть, способная генерировать видеоролики по текстовому описанию. Kandinsky 2.2 Генеративные анимации Модель Kandinsky 2.2 позволяет создавать анимационные видеоролики с частотой 24 кадра в секунду и разрешением 640×640 пикселей на основе одного или нескольких текстовых запросов. На каждый запрос генерируется 4-х секундный фрагмент видео, при этом синтез 1 секунды видео в среднем занимает около 20 секунд. При создании ролика доступно 16 вариантов анимации сцены: движение влево, вправо, по кругу, бесконечное приближение и удаление и многие другие режимы. В основе всех режимов анимации лежит функция перерисовки изображения по текстовому описанию. Модель Kandinsky 2.2 позволяет создавать анимационные видеоролики с частотой 24 кадра в секунду и разрешением 640x640 пикселей на основе одного или нескольких текстовых запросов. Kandinsky 2.2 Модель Kandinsky 2.2 позволяет создавать изображения более высокого разрешения — до 1024 пикселей — с различным соотношением сторон, а получающиеся результаты обладают высокой степенью фотореалистичности. Архитектурно Kandinsky 2.2 не отличается от версии 2.1, но за счёт увеличения энкодера изображений для Image prior модели до версии CLIP-g удалось повысить качество генераций. Также в рамках общей архитектуры мы перестали передавать текстовые эмбеддинги в диффузионную модель UNet. Модель Kandinsky 2.2 позволяет создавать изображения более высокого разрешения — до 1024 пикселей — с различным соотношением сторон, а получающиеся результаты обладают высокой степенью фотореалистичности. Kandinsky 2.1 Модель Kandinsky 2.1 построена на обратной латентной диффузии, а специальный image prior блок вместе с новым декодером изображений позволяют добиться впечатляющего качества. Kandinsky 2.1 разработана исследователями команды Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и SberDevices. Модель Kandinsky 2.1 построена на обратной латентной диффузии, а специальный image prior блок вместе с новым декодером изображений позволяют добиться впечатляющего качества. ruDALL-E Kandinsky (XXL) Русская text-to-image модель, генерирующая изображения по тексту. Архитектура такая же, как у ruDALL-E XL. Ещё больше параметров в новой версии! Русская text-to-image модель, генерирующая изображения по тексту. Архитектура такая же, как у ruDALL-E XL. Ещё больше параметров в новой версии! ruDALL-E Malevich (XL) По короткому текстовому описанию ruDALL-E генерирует яркие и красочные изображения на самые разные темы и сюжеты. Модель понимает обширный набор понятий и генерирует совершенно новые изображения и объекты, которых не существовало в реальном мире. По короткому текстовому описанию ruDALL-E генерирует яркие и красочные изображения на самые разные темы и сюжеты. ruDALL-E Emojich По короткому текстовому описанию ruDALL-E генерирует смайлики, которые можно использовать для стикеров, клипартов и прототипов дизайна. Модель понимает обширный набор понятий и генерирует совершенно новые эмодзи, которых не существовало до этого. По короткому текстовому описанию ruDALL-E генерирует смайлики, которые можно использовать для стикеров, клипартов и прототипов дизайна. Скачать ruDALL-E Прикрепления:
0716887.png
(449.0 Kb)
|
| |||
| |||