Вибір тензорних акселераторів під конкретні задачі: що таке compute/memory bound models, «арифметична інтенсивність» та квантування моделей

Ми як провайдер бачимо що нерідко потенційні клієнти дещо дезорієнтовані в питаннях вибору акселераторів. Технології змінюються дуже швидко, тому питання «а що там на ринку, а чим відрізняються всі ці картки, а які кращі» мають місце бути. І критерії вибору досить непрості. Що таке compute/memory bound models, «арифметична інтенсивність» і квантування моделе? Ці характеристики мають вирішальне значення при виборі інфраструктури.

Геннадій Карпов
De Novo, CTO
  • В ІТ з 1995 року, кандидат фізико-математичних наук.
  • Один з засновників De Novo (2008) та авторів бізнес-ідеї і високорівневої архітектури комерційного ЦОД (2007-2010) та першої української хмари (2010-2012).
  • Зараз сфера професійних інтересів сфокусована на розробці хмарних сервісів класу PaaS (managed Kubernetes, scalable object storage, database as a service, AI/ML-workspace та інші) в українській хмарі та для України.
  • LinkedIn, Facebook
Увійти
Або поштою
Увійти
Або поштою
Реєстрація через e-mail
Реєстрація через e-mail
Забули пароль?