
Чіпи Nvidia успішно навчають найбільші системи ШІ
Найновіші чіпи компанії Nvidia, зокрема архітектура Blackwell, продемонстрували разючу ефективність у навчанні найбільших мовних моделей. Вони скоротили час та ресурси, необхідні для обробки великих обсягів даних.
Чіпи Nvidia та навчання ШІ
Тестування охоплювало моделі на кшталт Llama 3.1 405B від Meta, які мають сотні мільярдів параметрів і потребують надпотужного апаратного забезпечення для навчання. Виявилося, що нове покоління чіпів Nvidia у понад два рази перевершує попередні чипи Hopper за швидкістю.
Один із найкращих результатів: 2496 чіпів Blackwell завершили тренування менш ніж за пів години – всього за 27 хвилин. Це стало можливим завдяки новому підходу – розподілу задач між меншими групами чіпів, а не традиційним гігантським масивам у сотні тисяч одиниць.
Як зазначив Четан Капур, директор з продуктів у компанії CoreWeave, що тісно співпрацює з Nvidia, індустрія ШІ відходить від масового об’єднання чіпів. Натомість фокусуються на гнучких архітектурах, які дозволяють адаптувати навчальні системи під конкретні завдання.
Такий підхід відкриває шлях до створення ще складніших моделей, розміром у трильйони параметрів, не жертвуючи продуктивністю.