То, что просили: в Gemini теперь можно загружать аудио и “любые” файлы

9 сентября 2025
2 Mins Read
25 Views

То, что просили: в Gemini теперь можно загружать аудио и "любые" файлы

В начале августа появились слухи, что Google работает над одной из самых ожидаемых функций для Gemini — поддержкой загрузки аудиофайлов. Теперь эта возможность уже доступна на Android, iOS и в веб-версии приложения.

О нововведениях сообщил Джош Вудворд, вице-президент Google Labs и Gemini. Он подтвердил, что теперь пользователи могут загружать любые файлы в приложение, включая наиболее часто запрашиваемый формат — аудио. Если нажать на иконку «+» и выбрать Upload files в веб-версии или Files на смартфоне, можно добавлять MP3, WAV и другие распространенные форматы.

Согласно обновленной документацией поддержки Google, за один запрос разрешено загружать до 10 файлов. Общая продолжительность аудио ограничена 10 минутами для бесплатных пользователей. Если же оформить подписку Google AI Pro или AI Ultra, лимит возрастает до трех часов. Несмотря на ограничения, даже 10 минут звучат существенно. Ведь, для сравнения, видео в Gemini можно загружать продолжительностью только до 5 минут. Для платных пользователей этот порог увеличивается до часа.

Кроме поддержки аудио, Google объявила еще два важных обновления для своих продуктов на базе Gemini. Во-первых, поиск Google Search в режиме AI Mode получил пять новых языков: хинди, индонезийский, японский, корейский и бразильский португальский. Это стало возможным благодаря интеграции Gemini 2.5 в поисковый сервис. Компания отмечает, что благодаря этому больше пользователей смогут задавать сложные вопросы на родном языке и получать более глубокие результаты.

Во-вторых, ИИ-блокнот NotebookLM, который работает на базе Gemini, получил новые стили отчетов. Он позволяет создавать учебные материалы, краткий обзор, блоги, карточки для запоминания, тесты и другие форматы на более чем 80 языках. NotebookLM анализирует загруженные документы, файлы и другие материалы пользователя и формирует результат в заданном стиле. Теперь можно выбирать структуру, тон и стиль создаваемых отчетов. По словам Google, обновление станет доступно всем пользователям на этой неделе.

Стоит отметить, что возможность работать с аудио в NotebookLM была еще до появления этой функции в основном приложении Gemini. Именно NotebookLM позиционируется как инструмент для исследований и выявления закономерностей в файлах различных форматов.

Последние месяцы Google активно расширяет экосистему функций, связанных с ИИ. В августе Gemini начал автоматически запоминать детали и предпочтения пользователей из предыдущих диалогов. Тогда же бесплатные аккаунты получили доступ к Workspace Vids — инструменту для генерации видео. В сентябре Google Photos перешел на новую версию генератора видео Veo 3 и позволил бесплатным пользователям создавать короткие 4-секундные видео из своих фотографий.

Источник: androidauthority, theverge

itc.ua

Exit mobile version