Veo 3.1 Fast — флагманская видеомодель Google DeepMind, которая выделяется среди всех конкурентов одной уникальной функцией: она генерирует видео с нативным звуком. Все остальные AI-видеомодели создают только визуальный ряд — звук приходится добавлять отдельно в видеоредакторе. Veo 3.1 понимает описание звукового сопровождения прямо в промпте и генерирует аудио одновременно с изображением.
Это означает, что сцена на пляже получит звук прибоя и крики чаек, дождь в городе — характерный шум капель о брусчатку, а диктор в кадре будет синхронно «произносить» указанную речь. Качество нативного аудио уже сейчас достаточное для контента соцсетей и промо-материалов.
Помимо звука, Veo 3.1 Fast отличается реалистичной физикой движений и качественной обработкой сложных сцен. Стоимость 40 кредитов за ролик отражает уникальность модели — для контента, где важен звук без постобработки, это инструмент выбора.