Компания Twelve Labs, специализирующаяся на генеративном искусственном интеллекте, объединила усилия с Amazon Web Services, чтобы сделать видеоконтент таким же доступным для поиска, как и текстовые материалы
Компания Twelve Labs, специализирующаяся на генеративном искусственном интеллекте, объединила усилия с Amazon Web Services, чтобы сделать видеоконтент таким же доступным для поиска, как и текстовые материалы. Сегодня на мероприятии re:Invent компания Amazon Web Services, Inc. (AWS), являющаяся подразделением Amazon.com, Inc. (NASDAQ: AMZN), объявила о том, что Twelve Labs, стартап, использующий мультимодальный искусственный интеллект (ИИ) для придания видеоконтенту человеческого понимания, создаёт и масштабирует свои собственные базовые модели на AWS. Twelve Labs будет использовать технологии AWS для ускорения разработки своих базовых моделей, которые сопоставляют естественный язык с тем, что происходит внутри видео. Это включает в себя действия, объекты и фоновые звуки, что позволяет разработчикам создавать приложения, которые могут выполнять поиск по видео, классифицировать сцены, суммировать и разбивать видеоклипы на главы. Эти базовые модели, доступные на AWS Marketplace, позволяют разработчикам создавать приложения для семантического поиска видео и генерации текста, обслуживая медиа, развлечения, игры, спорт и другие отрасли, зависящие от больших объёмов видео. Например, спортивные лиги могут использовать эту технологию для оптимизации процесса каталогизации обширных библиотек игровых кадров, что упрощает извлечение определённых кадров для прямых трансляций. Кроме того, тренеры могут использовать эти базовые модели для анализа техники гребка пловца или стартовой позиции спринтера, внося корректировки, которые приводят к лучшим результатам. Медиа- и развлекательные компании могут использовать технологию Twelve Labs для создания нарезок лучших моментов из телевизионных программ, адаптированных под интересы каждого зрителя, например, для компиляции всех последовательностей действий в триллере с любимым актёром. «Twelve Labs была основана с целью помочь разработчикам встроить мультимодальный интеллект в свои приложения», — сказал Джей Ли, соучредитель и генеральный директор Twelve Labs. «Почти 80% мировых данных находятся в видео, но большая их часть недоступна для поиска. Теперь мы можем решить эту проблему, выводя на поверхность высококонтекстные видео, чтобы оживить опыт, похожий на то, как люди видят, слышат и понимают мир вокруг нас». «AWS предоставила нам вычислительную мощность и поддержку для решения задач мультимодального ИИ и повышения доступности видео, и мы рассчитываем на плодотворное сотрудничество в ближайшие годы, поскольку мы продолжаем наши инновации и расширяемся в глобальном масштабе», — добавил Ли. «Мы можем ускорить обучение наших моделей, безопасно доставить наше решение тысячам разработчиков по всему миру и контролировать затраты на вычисления — и всё это благодаря AWS», — сказал Ли. при этом расширяя границы понимания и создания видео с помощью генеративного ИИ». Источник: www.businesswire.com
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ