Зимняя конференция ТюмГУ «подогрела» интерес к компьютерной лингвистике
Молодежная научно-практическая конференция «Множественность интерпретаций — 7: цифровая перезагрузка» прошла в ТюмГУ при поддержке Российского фонда фундаментальных исследований. Она привлекла внимание филологов, историков, лингвистов, антропологов, математиков, педагогов, специалистов по IT-технологиям из России и из-за рубежа.
В рамках конференции впервые была организована двухдневная школа компьютерной лингвистики. Спикер школы, программист-исследователь в проекте iPavlov, преподаватель МГУ Алексей Сорокин, в течение многих лет занимающийся разработкой курсов компьютерной лингвистики, рассказал: «Математическая лингвистика появилась в начале 1950-х годов. И в Советском Союзе, и в США уделялось большое внимание работе с машинным переводом, чтобы переводить документы и различные тексты на языке вероятного противника. Несмотря на то что в этом направлении трудились лучшие умы математики и лингвистики, тем не менее качество машинных переводов оставляло желать лучшего. Ренессанс компьютерной лингвистики пришелся на 90-е годы. Люди поняли, что важно иметь больше данных и меньше предположений, как эти данные устроены. Из них можно извлечь очень много информации».
Сегодня компьютерная лингвистика вышла на новый уровень своего развития и применяется в повседневной жизни во многих сферах.
«К примеру, владелец кинотеатров хочет проанализировать, почему у него падают продажи. В результате исследования он имеет массу отзывов из разных соцсетей, с сайта заказов билетов и других источников. Далее, во-первых, ему нужно понять, какие тексты положительные, какие отрицательные. Он обращается к автоматическому анализу тональности. Во-вторых, ему нужно понять, к какому аспекту относится этот негативный отзыв: к кинотеатру, к самому фильму или к вкусовым качествам попкорна в этом кинотеатре… Это значит, что ему надо понимать структуру предложения, отсюда идет морфология, синтаксис и семантика. И, соответственно, для такой бизнес-задачи, в которой на первый взгляд нет никакой науки, на самом деле оказывается нужна вся современная компьютерная лингвистика», — резюмирует программист-исследователь.
Основы компьютерной лингвистики преподаются в ТюмГУ на программах магистратуры и аспирантуры.
Цифровая гуманитаристика является одним из приоритетных научных направлений СоцГум.
Источник:
Управление стратегических коммуникаций ТюмГУ