Новий алгоритм ШІ для роботів, виявився кращим за інші
Інженери Північно-західного університету спеціально для розумної робототехніки створили новий алгоритм штучного інтелекту. Він допомагає роботам швидко вивчати нові навички та робить їх більш корисними. Нова технологія стане незамінним елементом в безпілотних автомобілях, дронах для доставки, домашніх помічниках тощо.
Як працюють алгоритми ШІ
Якщо говорити простими словами, то для створення умовного алгоритму штучного інтелекту дослідники використовують великі обсяги даних. Вони їх ретельно фільтрують, обробляють і відсилають генеративній моделі ШІ. Штучний інтелект вивчає ці тренувальні дані і, методом проб та помилок, згодом досягає оптимальних результатів в роботі. По такому принципу були створені ChatGPT і Google Gemini, та інші безтілесні форми ШІ.
Однак така концепція не підходить для робототехніки. По-перше, безтілесним системам доступні переваги світу, у якому фізичні закони не діють. По-друге, невдачі не мають наслідків. Інформаційні додатки з функціями ШІ успішно працюють більшу частину часу, і це головне. Але якщо робот помилиться в роботі, то це може стати справжньою катастрофою.
Чим новий алгоритм відрізняється від уже створеного
Щоб вирішити цю проблему Томас Берруета, Тодд Мерфі та Еллісон Піноскі розробили новий алгоритм. Він називається Maximum Diffusion Reinforcement Learning (MaxDiff RL). Завдяки йому роботи навчаються самостійно, без допомоги людей-кураторів. Вони збирають та обробляють дані на ходу, постійно скануючи своє середовище. Навчаючись таким чином, вони набувають необхідних навичок для виконання практичних завдань.
Дослідження показали, що роботи з алгоритмом Maximum Diffusion Reinforcement Learning (MaxDiff RL) здатні виконувати нові завдання різного типу складності з першого разу.