Вибір тензорних акселераторів під конкретні задачі: що таке compute/memory bound models, «арифметична інтенсивність» та квантування моделей
Ми як провайдер бачимо що нерідко потенційні клієнти дещо дезорієнтовані в питаннях вибору акселераторів. Технології змінюються дуже швидко, тому питання «а що там на ринку, а чим відрізняються всі ці картки, а які кращі» мають місце бути. І критерії вибору досить непрості. Що таке compute/memory bound models, «арифметична інтенсивність» і квантування моделе? Ці характеристики мають вирішальне значення при виборі інфраструктури.

Геннадій Карпов
De Novo, CTO
- В ІТ з 1995 року, кандидат фізико-математичних наук.
- Один з засновників De Novo (2008) та авторів бізнес-ідеї і високорівневої архітектури комерційного ЦОД (2007-2010) та першої української хмари (2010-2012).
- Зараз сфера професійних інтересів сфокусована на розробці хмарних сервісів класу PaaS (managed Kubernetes, scalable object storage, database as a service, AI/ML-workspace та інші) в українській хмарі та для України.
- LinkedIn, Facebook