Computer Use Agents: From SFT to Classic RL [ukr]

Розкажу про Computer/Browser/Mobile Use агентів. Почнемо з API, які надають нам OpenAI та Claude під задачі Computer Use. Згадаємо, як тренуються LLM/VLM, що таке RL і як його тут можна застосувати. Розберемо свіжі open-source модельки та поговоримо про evaluation таких агентів.

Максим Шамрай
Research Scientist at MacPaw
  • Research Scientist в MacPaw AI Research (AIR), де займається прикладними дослідженнями в області AI
  • Аспірант Інституту Математики НАН України, досліджує методи оптимізації моделей нейронних мереж та методи оптимального керування
  • Викладає "Computer Vision" магістрам Київського Академічного Університету (КАУ)
  • Цікавиться математикою в AI, зокрема в Reinforcement Learning
  • Має досвід як в research, так й в production
  • LinkedIn
Увійти
Або поштою
Увійти
Або поштою
Реєстрація через e-mail
Реєстрація через e-mail
Забули пароль?