Новий штучний інтелект EMO анімує зображення людей
Дослідники з Інституту інтелектуальних обчислень компанії Alibaba розробили систему штучного інтелекту EMO (Emote Portrait Alive), що здатна анімувати статичні зображення людей, надаючи їм можливість реалістично говорити та співати.
Група розробників, очолювана Ліньжуй Тянем, використовувала дифузійну модель ШІ, навчену на масиві даних, включаючи понад 250 годин відеозаписів “голови, що говорить”, для створення анімації без потреби у 3D-моделях чи лицьових опорних точках.
Система EMO відзначається своєю здатністю передавати емоційні вирази обличчя та рухи голови, точно відтворюючи емоційні відтінки звукового ряду. Вона враховує не лише мовні вирази, але й вокальні характеристики, синхронізуючи рухи з вокальними партіями та додаванням відповідної міміки.
Під час тестування фокус-групою дослідники зауважили, що відеоролики, створені за допомогою EMO, виглядають природніше та емоційніше порівняно з іншими системами.
Однак, разом з успіхом виникла і певна область потенційного зловживання технологією. Дослідники планують вивчити методи виявлення створених ШІ відеороликів для запобігання можливого негативного використання.