Патенты наших преподавателей

27 января 2022
«Научно-исследовательская программа для автоматического определения тональности предложений на русском языке»  — программа, реализующая нашу адаптацию алгоритма анализа тональности предложений, изначально предложенного для английского языка О. Аппелем.
«Научно-исследовательская программа для визуализации идентифицированных в предложении единиц тональности» — вспомогательная, помогающая лучше анализировать результаты работы первой.
В чём вообще идея: когда-то давно было две основные технологии в компьютерной лингвистике — т.н. семантические правила и машинное обучение. Первый подход предполагал изучение структуры языка и составление (вручную) алгоритма, который будет анализировать текст. Второй подход предполагал преобразование текста в какое-то формальное представление (например, вектор чисел) и обучение на множестве таких векторов какой-нибудь модели. В последнее время, по понятной причине, второй подход стал сильно популярнее первого (обоснованно, т.к. мощная нейросеть позволяет давать достаточно качественные результаты). Но проблема в том, что современные нейросети представляют собой чёрный ящик, и почти никогда нельзя сказать, почему именно они, например, ошибаются. Поэтому мы в лаборатории попробовали немного возродить интерес к вот тем подходам, основанным на синтаксических правилах (для которых анализ ошибок проблемы не представляет), начав с адаптации одного из подходов для русского языка. Получилось относительно неплохо — отставание от современных нейросетей (в частности, от RuBERT), конечно, есть, но оно было в пределах 5-7%, и мы сделали вывод о том, что есть смысл развивать это направление дальше.

Лаборатории FRUCT, под руководством Ильи Вячеславовича Парамонова.




  • 35
    лет факультету
  • Более 2000
    выпускников
Подавать сертификаты ЕГЭ вместе с другими документами не нужно, ваши баллы будут проверяться в федеральной базе.