Gemini Advanced теперь генерирует видео — и это впечатляет
По данным Digitaltrends, компания Google сделал новый шаг в развитии ИИ, добавив в премиум-версию своего ассистента Gemini Advanced возможность создавать 8-секундные анимированные видео по текстовому описанию. Функция работает на базе модели Veo 2, представленной в конце 2024 года, и умеет реалистично воспроизводить движения, сцены и даже эффекты камеры.
Как это работает?
- Пользователь вводит текстовый запрос (например, «кот в шляпе танцует на луне»).
- Чем детальнее описание — тем точнее результат.
- Gemini Advanced обрабатывает запрос и через Veo 2 генерирует MP4-видео в 720p (16:9).
- Готовый ролик можно скачать или сразу опубликовать в соцсетях (Facebook, X, Reddit).
Примеры созданных видео
- K-pop группа на стадионе: ИИ корректно отобразил толпу фанатов с светящимися палочками и даже добавил корейские субтитры.
- НЛО над заброшенной фермой: Камера плавно движется по тропинке, а вдали зависают НЛО — динамика и детализация на уровне.
«Veo 2 отлично дополняет сцены, даже если запрос расплывчатый. Например, для «девушки в дожде» он сам добавил мокрый асфальт и отражения», — отмечают тестеры.
Ограничения
- Длина видео — строго 8 секунд.
- Невозможно загрузить референсное изображение для стиля (в отличие от Whisk, другого инструмента Google).
- Пока доступно только подписчикам Gemini Advanced ($20/месяц).
Как попробовать?
- Оформите подписку Gemini Advanced (входит в Google One AI Premium).
- В веб-версие или приложении выберите модель Veo 2 в выпадающем меню.
- Введите запрос и ждите результат (генерация занимает 1-2 минуты).