05.02.2025 17:29

ByteDance представила модель ИИ для реалистичных видео

Компания ByteDance, владеющая соцсетью TikTok, представила модель искусственного интеллекта OmniHuman-1, способную создавать видео с изображением людей на основе фотографии и аудио.

Это было объявлено исследователями, работавшими над проектом. Платформа OmniHuman предлагает генерацию видео на основе одного изображения и сигналов движения, таких как аудио, видео или их комбинация. Модель способна создавать реалистичные видео с изображением людей на основе слабых входных сигналов, поддерживает различные визуальные и звуковые стили, а также может работать с разными пропорциями тела и соотношениями сторон. В OmniHuman улучшено отображение жестов, что ранее было проблемой для подобных моделей ИИ. ByteDance пока не выпустила данную модель официально. Согласно сообщениям, компания планирует инвестировать более 12 миллиардов долларов в развитие инфраструктуры, связанной с искусственным интеллектом, включая приобретение ИИ-чипов. По данным информационного центра сети интернет в Китае, к концу декабря 2024 года количество пользователей продуктов генеративного искусственного интеллекта в Китае достигло 230 миллионов человек.

Источник и фото - ria.ru