Google расширила функциональность чат-бота Gemini, внедрив генерацию музыкального контента на базе модели Lyria 3. Теперь пользователи могут создавать короткие треки с вокалом или без него на основе текстовых описаний, изображений и видео. О запуске функции сообщает издание Beebom, пишет КТРК.
Как работает новая функция
Музыкальная модель Lyria 3, разработанная лабораторией Google DeepMind, ранее применялась через облачные инструменты для разработчиков, включая Vertex AI. Теперь она интегрирована непосредственно в интерфейс Gemini.
Пользователю больше не требуется отдельно прописывать текст песни. Если в запросе указан только жанр, настроение или тема, система самостоятельно создаёт слова. При необходимости можно сгенерировать инструментальную композицию без вокала.
Lyria 3 позволяет:
- задать жанр и атмосферу трека;
- указать тип вокала;
- описать темп и характер звучания;
- использовать личные воспоминания или внутренние шутки как основу сюжета.
Система формирует композицию продолжительностью около 30 секунд — фактически музыкальный эскиз.
Фото и видео как источник вдохновения
Gemini принимает не только текстовые подсказки, но и изображения или видеоролики. Загруженное фото может стать основой для создания песни с текстом, соответствующим атмосфере снимка. Аналогично работает видео — модель анализирует визуальный контекст и адаптирует настроение музыки.
К каждому треку автоматически создаётся обложка с помощью модели Nano Banana, что упрощает публикацию композиции в социальных сетях или распространение по ссылке.
Авторские права и маркировка
В официальном блоге Google подчёркивается, что инструмент предназначен для «оригинального самовыражения», а не копирования известных исполнителей. Если в запросе упоминается конкретный артист, система воспринимает это как стилистическое вдохновение, а не попытку воспроизвести голос.
Как отмечает Ars Technica, все аудиофайлы получают цифровую метку SynthID. Пользователь может загрузить трек в Gemini и проверить, создан ли он с помощью искусственного интеллекта Google. Ранее аналогичная технология применялась для изображений и видео.
Компания признаёт, что механизмы защиты не являются абсолютно безошибочными, поэтому предусмотрена возможность подачи жалоб при возможном нарушении прав.
Доступность функции
Генерация музыки постепенно становится доступной пользователям старше 18 лет в разных странах, включая Украину. Поддерживаются английский, немецкий, испанский, французский, хинди, японский, корейский и португальский языки. В дальнейшем компания планирует расширить языковую поддержку.
Подписчики Google AI Plus, Pro и Ultra получат более высокие лимиты использования, однако точные параметры пока не раскрываются.
Параллельно Lyria 3 интегрируется в Dream Track для YouTube Shorts, что позволит авторам создавать собственные саундтреки для коротких видео.
Напомним, ранее мы писали про интерактивную игру Google с ИИ, через которую раскрыты даты I/O 2026.
