Computer Use Agents: From SFT to Classic RL [ukr]
Розкажу про Computer/Browser/Mobile Use агентів. Почнемо з API, які надають нам OpenAI та Claude під задачі Computer Use. Згадаємо, як тренуються LLM/VLM, що таке RL і як його тут можна застосувати. Розберемо свіжі open-source модельки та поговоримо про evaluation таких агентів.

Максим Шамрай
Research Scientist at MacPaw
- Research Scientist в MacPaw AI Research (AIR), де займається прикладними дослідженнями в області AI
- Аспірант Інституту Математики НАН України, досліджує методи оптимізації моделей нейронних мереж та методи оптимального керування
- Викладає "Computer Vision" магістрам Київського Академічного Університету (КАУ)
- Цікавиться математикою в AI, зокрема в Reinforcement Learning
- Має досвід як в research, так й в production