Computer Use Agents: From SFT to Classic RL [ukr]

Презентація доповіді

Розкажу про Computer/Browser/Mobile Use агентів. Почнемо з API, які надають нам OpenAI та Claude під задачі Computer Use. Згадаємо, як тренуються LLM/VLM, що таке RL і як його тут можна застосувати. Розберемо свіжі open-source модельки та поговоримо про evaluation таких агентів.

Максим Шамрай

Research Scientist at MacPaw

Research Scientist в MacPaw AI Research (AIR), де займається прикладними дослідженнями в області AI
Аспірант Інституту Математики НАН України, досліджує методи оптимізації моделей нейронних мереж та методи оптимального керування
Викладає "Computer Vision" магістрам Київського Академічного Університету (КАУ)
Цікавиться математикою в AI, зокрема в Reinforcement Learning
Має досвід як в research, так й в production
LinkedIn

Квитки на наступну конференцію Fwdays Tech Summit вже у продажі!

Computer Use Agents: From SFT to Classic RL [ukr]

Презентація доповіді