ByteDance выкатила Bernini — новую систему для генерации и редактирования видео, где MLLM-модель сначала «планирует» сцену на семантическом уровне, а уже потом диффузионная модель рендерит итоговый ролик. По сути, ИИ сначала думает, потом рисует. 🤯
Проект построен на базе WAN 2.2 и дополнительных чекпоинтах от команды ByteDance, а также моделей, указанных авторами в репозитории. Поддерживаются генерация видео, редактирование, работа с референсами и вставка объектов в готовые ролики.
Потестить можно тут:
bernini-ai.github.io
#AI #VideoGeneration #ByteDance #WAN22 #pepewtfa