Новий AI-модель Google генерує ігрові світи у реальному часі

Google DeepMind анонсує нову версію свого штучного інтелектуального «світового» моделі, яка отримала назву Genie 3. Ця модель здатна створювати 3D-середовища, в яких користувачі та агенти ШІ можуть взаємодіяти в режимі реального часу. Компанія також обіцяє, що користувачі зможуть взаємодіяти з цими світами значно довше, ніж раніше, а модель запам’ятає, де знаходяться об’єкти, коли ви відволікатимете погляд від них.

### Що таке світові моделі?

Світові моделі – це тип штучного інтелекту, який може імітувати середовища для таких цілей, як освіта, розваги або підготовка роботів і агентів ШІ. З допомогою світових моделей ви задаєте натяк, і система генерує простір, в якому ви можете переміщуватись, як у відеогрі, але на відміну від створеного вручну світу з 3D-об’єктами, усе генерується з використанням ШІ. Це напрямок, який Google активно розвиває; компанія продемонструвала Genie 2 у грудні, який міг створювати інтерактивні світи на основі зображення, і формує команду, що працює над світовими моделями, якою керує колишній співкерівник інструменту генерації відео Sora з OpenAI.

### Проблеми існуючих моделей

Проте, у наявних моделів є чимало недоліків. Наприклад, світи Genie 2 могли бути доступними лише на одиницю часу, не більше хвилини. Нещодавно я спробував «інтерактивне відео» від компанії, що отримала фінансування від співзасновника Pixar, і це нагадувало прогулянку розмитою версією Google Street View, де все змінювалось і перетворювалось несподіваним чином, коли я оглядався.

### Прогрес у Genie 3

Genie 3, за усіма ознаками, може стати важливим кроком вперед. Користувачі зможуть генерувати світи з натяком, що підтримує «кілька» хвилин безперервної взаємодії, в порівнянні з 10-20 секундами в Genie 2. Google повідомляє, що Genie 3 може зберігати простори в зоровій пам’яті приблизно протягом хвилини, що означає, що, якщо ви відвернетесь від об’єкта в світі, а потім знову обернетесь до нього, такі елементи, як фарба на стіні чи напис на дошці, залишаться на своїх місцях. Світи також матимуть роздільну здатність 720p і працюватимуть на 24 кадри в секунду.

### Нові можливості Genie 3

DeepMind також впроваджує у Genie 3 те, що називається «подіями світового масштабу, які можна викликати за допомогою натяків». Використовуючи натяк, ви зможете змінювати погодні умови в світі або додавати нових персонажів.

### Доступність моделі

Однак, ця модель, ймовірно, буде доступна лише обмеженій кількості користувачів. Вона з’явиться як «обмежена дослідна версія», що буде доступна «невеликій групі науковців та творців», щоб її розробники могли краще зрозуміти ризики та відповідно їх зменшити. Існують також численні обмеження, як-от обмежені способи взаємодії користувачів з створеними світами, а також те, що читабельний текст «часто генерується лише тоді, коли він наведений у описі світу». Google заявляє, що «досліджує» можливості розширення доступу до Genie 3 для «додаткових тестувальників» у майбутньому.

Грицай Микита

Related Posts