27 января 2022
«Научно-исследовательская программа для автоматического определения тональности предложений на русском языке» — программа, реализующая нашу адаптацию алгоритма анализа тональности предложений, изначально предложенного для английского языка О. Аппелем. «Научно-исследовательская программа для визуализации идентифицированных в предложении единиц тональности» — вспомогательная, помогающая лучше анализировать результаты работы первой.
В чём вообще идея: когда-то давно было две основные технологии в компьютерной лингвистике — т.н. семантические правила и машинное обучение. Первый подход предполагал изучение структуры языка и составление (вручную) алгоритма, который будет анализировать текст. Второй подход предполагал преобразование текста в какое-то формальное представление (например, вектор чисел) и обучение на множестве таких векторов какой-нибудь модели. В последнее время, по понятной причине, второй подход стал сильно популярнее первого (обоснованно, т.к. мощная нейросеть позволяет давать достаточно качественные результаты). Но проблема в том, что современные нейросети представляют собой чёрный ящик, и почти никогда нельзя сказать, почему именно они, например, ошибаются. Поэтому мы в лаборатории попробовали немного возродить интерес к вот тем подходам, основанным на синтаксических правилах (для которых анализ ошибок проблемы не представляет), начав с адаптации одного из подходов для русского языка. Получилось относительно неплохо — отставание от современных нейросетей (в частности, от RuBERT), конечно, есть, но оно было в пределах 5-7%, и мы сделали вывод о том, что есть смысл развивать это направление дальше.
Лаборатории FRUCT, под руководством Ильи Вячеславовича Парамонова.
-
35лет факультету
-
Более 2000выпускников
Подавать сертификаты ЕГЭ вместе с другими документами не нужно, ваши баллы будут проверяться в федеральной базе.