Waveglow. Генеративне моделювання для синтезу аудіо

Відео доповіді

Презентація доповіді

Waveglow - швидка паралельна генеративна нейронна мережа без авторегресії. Поєднує в собі ідеї Glow та WaveNet, оптимізується, використовуючи єдину функцію втрат, котра максимізує правдоподібність тренувальних даних.

Модель здатна синтезувати високоякісне аудіо в 22 рази швидше ніж у реальному часі.

Тарас Середа

VocalicsAI

Співзасновник та директор з досліджень VocalicsAI
Дослідник машинного навчання та підприємець, працює над алгоритмами синтезу мови.
У вільний час катається на велосипеді або паяє аналоговий синтезатор.

Квитки на наступну конференцію Fwdays Tech Summit вже у продажі!

Waveglow. Генеративне моделювання для синтезу аудіо

Відео доповіді

Презентація доповіді