Google презентувала Flow, інноваційний інструмент, що об'єднує всі свої генеративні моделі, включаючи Imagen для зображень, Veo для відео, та текстову модель Gemini для створення відеокліпів і сцен.
Користувачі зможуть виразити ідею для відео через Gemini, створити необхідні елементи за допомогою Imagen, а потім втілити задум за допомогою генеративної моделі Veo.
За інформацією Engadget, Flow також отримає додаткові функції редагування та постановки відео. Користувачі матимуть можливість обирати рухи камери та кути зйомки, а також редагувати та додавати нові кліпи і сцени. Крім того, Flow отримає власну систему управління активами для організації ресурсів і ваших підказок.
Новий інструмент Google буде доступний у США за підпискою Google AI Pro або новою AI Ultra. У рамках AI Pro, користувачі зможуть отримати доступ до моделі Veo 2, яка має кілька покращень, таких як контроль за рухом камери, функція "Перемальовування" для розширення кадру з портретного на альбомний формат, а також поліпшене розуміння тіней, масштабу та взаємодії об'єктів у відео.
У той же час, підписка Google AI Ultra надасть доступ до нової моделі Veo 3, найсучаснішої моделі генерації відео, яка не лише має кращу якість, ніж Veo 2, а й вперше може генерувати відео зі звуком, таким як шум транспорту, спів птахів або навіть діалоги персонажів.
Нагадаємо, що на Google I/O також був представлений чат-бот Gemini для Chrome, запуск розширення "Огляд від ШІ" у пошуку в Україні та інших регіонах, модель для генерації зображень Imagen 4 та інструмент для створення UI Stitch. Крім того, Google оголосила про співпрацю з Xreal над розумними окулярами Project Aura на базі Android XR.