Sesame представила голосового помічника Maya

Компанія Sesame представила свою нову модель Maya – голосового помічника, здатного відтворювати природне мовлення з вражаючою точністю. Проект створено на базі моделі CSM-1B, яка налічує 1 мільярд параметрів і знаходиться під відкритою ліцензією Apache 2.0. Це означає, що її можна використовувати в комерційних цілях, хоча з певними обмеженнями.

Що відомо про Maya

Основою CSM-1B є технологія RVQ (залишкове векторне квантування), яка дозволяє моделі кодувати аудіо у вигляді токенів. Аналогічні методи використовуються у SoundStream від Google та Encodec від Meta.

Maya працює на основі мовної моделі з сімейства Llama від Meta, поєднаної з потужним аудіодекодером. За словами компанії Sesame, це дозволяє створювати максимально реалістичні голоси, при тому, що модель не була спеціально налаштована на їхню імітацію.

Попри відкритий код, Sesame не розкрила, які саме дані були використані для навчання CSM-1B, що викликає певні питання щодо прозорості. Ба більше, реальних обмежень у використанні моделі не існує. Sesame лише закликає розробників не використовувати її для створення фейкових новин, обману чи імітації голосів без дозволу. Але як показують тести, клонувати голос за допомогою Maya можна менш ніж за хвилину, а потім згенерувати будь-який текст, навіть на суперечливі теми, такі як політичні вибори чи пропаганда.

Ця ситуація викликає занепокоєння у сфері цифрової безпеки. Consumer Reports попереджає, що більшість сучасних інструментів для клонування голосу на базі ШІ не мають ефективних механізмів захисту від зловживань або шахрайства.

Sesame представила голосового помічника нового покоління Maya

Що відомо про Maya

Залишити відповідь Скасувати коментар

Божко Ліза

Що відомо про Maya

Залишити відповідь Скасувати коментар

Божко Ліза

Related Posts