Waveglow. Генеративне моделювання для синтезу аудіо
Відео доповіді
Презентація доповіді
Waveglow - швидка паралельна генеративна нейронна мережа без авторегресії. Поєднує в собі ідеї Glow та WaveNet, оптимізується, використовуючи єдину функцію втрат, котра максимізує правдоподібність тренувальних даних.
Модель здатна синтезувати високоякісне аудіо в 22 рази швидше ніж у реальному часі.
Тарас Середа
VocalicsAI
- Співзасновник та директор з досліджень VocalicsAI
- Дослідник машинного навчання та підприємець, працює над алгоритмами синтезу мови.
- У вільний час катається на велосипеді або паяє аналоговий синтезатор.