Новости по компании MICROSOFT
Новость: нейтральная. Читает рэп Моны Лизы? Новый искусственный интеллект Microsoft анимирует лица с фотографий. Мона Лиза теперь может больше, чем просто улыбаться, благодаря новой технологии искусственного интеллекта от Microsoft. На прошлой неделе исследователи Microsoft подробно рассказали о разработанной ими новой модели искусственного интеллекта, которая может делать неподвижное изображение лица и аудиоклип говорящего человека и автоматически создавать реалистичное видео этого говорящего человека. Видео, которые могут быть созданы из фотореалистичных лиц, а также мультфильмов или произведений искусства, дополнены убедительной синхронизацией губ и естественными движениями лица и головы. В одном демонстрационном видео исследователи показали, как они анимировали Мону Лизу, чтобы она читала комедийный рэп актрисы Энн Хэтэуэй. Результаты модели искусственного интеллекта, получившей название VASA-1 , одновременно интересны и немного раздражают своей реалистичностью. Microsoft заявила, что эту технологию можно использовать для образования или «улучшения доступности для людей с проблемами общения» или, возможно, для создания виртуальных компаньонов для людей. Но также легко увидеть, как этим инструментом можно злоупотреблять и использовать его для выдачи себя за реальных людей. Эта проблема выходит за рамки Microsoft: по мере появления новых инструментов для создания убедительных изображений, видео и аудио, генерируемых искусственным интеллектом, эксперты опасаются , что их неправильное использование может привести к новым формам дезинформации. Некоторые также обеспокоены тем, что технология может еще больше разрушить творческие отрасли, от кино до рекламы. На данный момент Microsoft заявила, что не планирует немедленно выпускать модель VASA-1 для широкой публики. Этот шаг аналогичен тому, как партнер Microsoft OpenAI решает проблемы, связанные с его видеоинструментом Sora, созданным с помощью искусственного интеллекта: OpenAI дразнила Sora в феврале, но до сих пор предоставила его только некоторым профессиональным пользователям и профессорам кибербезопасности для целей тестирования. «Мы против любого поведения, направленного на создание вводящего в заблуждение или вредного контента реальных людей», — заявили исследователи Microsoft в своем блоге. Но, добавили они, у компании «нет планов публиковать» продукт, «пока мы не будем уверены, что технология будет использоваться ответственно и в соответствии с надлежащими правилами». Заставить лица двигаться: Новая модель искусственного интеллекта Microsoft была обучена на многочисленных видеороликах с лицами людей во время разговора и предназначена для распознавания естественных движений лица и головы, включая, среди прочего, «движение губ, выражение (не губ), взгляд и моргание», — говорят исследователи. В результате видео становится более реалистичным, когда VASA-1 анимирует неподвижное фото. Например, в одном демонстрационном видеоролике изображен взволнованный человек, по-видимому, играющий в видеоигры, лицо говорящего нахмурило брови и поджало губы. Инструмент искусственного интеллекта также можно настроить на создание видео, в котором объект смотрит в определенном направлении или выражает определенную эмоцию. Если присмотреться, все еще есть признаки того, что видео сгенерировано машиной, например редкое моргание и преувеличенные движения бровей. Но Microsoft заявила, что считает, что ее модель «значительно превосходит» другие аналогичные инструменты и «открывает путь к взаимодействию в реальном времени с реалистичными аватарами, имитирующими человеческое разговорное поведение». Автор: Clare Duffy. Источник: www.edition.cnn.com
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ