ALPHABET [новости]
НОВОСТИ АКЦИЙ США
Новости компании Google: HD-модель голоса
Компания Google интегрирует в свою платформу Vertex AI новую версию технологии распознавания голоса Chirp 3 с высоким разрешением. До сих пор основное внимание в области генеративного искусственного интеллекта уделялось текстовым интерфейсам, которые используются для создания текста, изображений и других материалов. Однако, похоже, что следующим шагом станет использование голоса, и этот тренд быстро набирает обороты. На прошлой неделе компания Google объявила о том, что с начала следующей недели добавит свой голосовой интерфейс HD — Chirp 3 — в свою платформу разработки Vertex AI. На прошлой неделе Google объявила о том, что в рамках новой версии Chirp 3 будет представлено 8 новых голосов для 31 языка. Возможности использования платформы включают создание голосовых помощников, аудиокниг, разработку агентов поддержки и озвучивание видео. Новость была озвучена на мероприятии, которое проходило в офисах Google DeepMind в Лондоне. В то же время другие компании активно работают над развитием голосовых технологий искусственного интеллекта. На прошлой неделе стартап Sesame, который стоит за вирусными приложениями ИИ «Maya» и «Miles», объявил о запуске своей модели для разработчиков, которые смогут создавать свои собственные приложения и сервисы на основе технологий Sesame. В частности, будут введены ограничения на использование Chirp 3, чтобы предотвратить его неправильное использование. «Мы работаем над этим вместе с нашей командой по безопасности», — сказал Томас Куриан, генеральный директор Google Cloud, на сегодняшнем мероприятии. Одним из крупнейших стартапов, которые привлекли сотни миллионов долларов инвестиций для развития своих голосовых сервисов на основе искусственного интеллекта, является ElevenLabs. Эта новость ставит Chirp 3 в один ряд с новыми версиями флагманского LLM Gemini, которые сейчас проходят тестирование, а также с моделью генерации изображений Imagen и дорогим инструментом генерации видео Veo 2. Можно поспорить, будет ли то, что Google выпускает с Chirp 3, таким же «реалистичным», как некоторые другие попытки искусственного интеллекта создать «человеческие» голоса (особенно выделяется работа Sesame). Но, как подчеркнул Демис Хассабис, генеральный директор DeepMind, это всё ещё марафон, а не спринт. «В ближайшем будущем... идея о том, что [искусственный интеллект] станет решением всех проблем в ближайшие пару лет, пока не кажется мне правдоподобной. Я думаю, что нам ещё далеко до того, чтобы нечто подобное произошло в ближайшие несколько лет», — сказал он. «Это изменит всё... в течение следующего десятилетия, то есть в среднесрочной и долгосрочной перспективе. Это один из тех интересных моментов во времени». Google запустил Vertex AI в 2021 году как платформу для разработчиков, позволяющую создавать сервисы машинного обучения в облаке. Это было, конечно, задолго до всплеска интереса к искусственному интеллекту, и в частности к генеративному искусственному интеллекту, который начался с запуском сервисов GPT от OpenAI. С тех пор компания всё больше внимания уделяет Vertex AI, поскольку она пытается догнать другие компании, такие как Microsoft и Amazon, которые создают инструментарий генеративного искусственного интеллекта для разработчиков. Помимо создания генеративного искусственного интеллекта на основе Gemini, разработчики могут использовать Vertex AI для классификации данных, обучения моделей и настройки моделей обучения для производства. Будет интересно посмотреть, расширит ли она свой защищённый сад на модели, выходящие за рамки тех, которые созданы самой Google. Компания Google уже много лет занимается разработкой голосовых сервисов под названием Chirp, начиная с использования этого названия в качестве кодового имени в своих ранних попытках конкурировать с сервисом Alexa от Amazon.