Feature engineering for abusive language detection for the Ukrainian language on Twitter
Відео доповіді
Презентація доповіді
Автоматичне виявлення образливої мови - вкрай актуальна проблема, вирішити яку намагаються багато популярних соціальних платформ. Ця задача досить непогано досліджена для англійської мови, але як можна вирішити це завдання для низькоресурсних мов, таких як українська, де доводиться працювати в умовах відсутності даних та інструментів для роботи з ними? Давайте спробуємо розібрати цю проблему з точки зору комп'ютерної лінгвістики та виявити найбільш вагомі ознаки образливої мови.
Валерія Лакуста
Grammarly
- Після закінчення Київського Національного Університету працювала комп'ютерною лінгвісткою у галузі машинного перекладу для Арабсько-Російської мовної пари і після - як розробниця чат-ботів.
- Наразі працює над розробкою стилістичних перевірок у Grammarly.
- Цікавиться інвективною лексикою, зокрема її соціокультурними аспектами у Єгипетському діалекті.