Цифровая перезагрузка и школа компьютерной лингвистики

Цифровая перезагрузка и школа компьютерной лингвистики

Общество и культура 21 Марта 2018 1252

В Институте социально-гуманитарных наук ТюмГУ состоялась ежегодная молодежная научно-практическая конференция «Множественность интерпретаций: Цифровая перезагрузка». Тема была выбрана неслучайно.

«Современные гуманитарные науки больше не смогут обходиться без цифровых технологий: объемы данных стали настолько велики, что их ручная обработка займет все время, которое есть у исследователя. Поэтому пленарное заседание и некоторые секции были посвящены исключительно цифровым технологиям в лингвистике, филологии, истории и т.д», – говорят организаторы.

По итогам будет подготовлен электронный сборник материалов конференции, проиндексированный РИНЦ и Google Scholar. Статьи получат уникальный идентификатор DOI.

Впервые в рамках конференции прошла школа компьютерной лингвистики ТюмГУ. Более 30 участников, среди которых преподаватели, студенты, аспиранты и даже школьники-участники олимпиад по информатике провели 14 часов, изучая основы программирования и компьютерной семантики.

Школа проходила по двум направлениям: основы компьютерной лингвистики на Python 3 и алгоритмы и методы дистрибутивной семантики. 

Первый трек провел Тимофей Архангельский, кандидат филологических наук, постдокторант Гамбургского университета (Германия). Курс был нацелен на тех, кто не умеет программировать, но хотел бы использовать возможности компьютерной лингвистики в своих исследованиях. 

«Python 3 – это самый популярный язык программирования среди тех, кто занимается цифровой гуманитаристикой, и, кроме того, один из самых используемых языков в мире. На нем созданы целые библиотеки готовых программ, которые позволяют легко и быстро обработать очень большие массивы данных. Главная сложность заключается в том, что у этих программ нет удобного интерфейса, поэтому работать с ними можно только так, как работают программисты над своими разработками», – отметил лектор.

Ученики первого трека получили набор базовых навыков, который позволит им воспользоваться возможностями Python 3 здесь и сейчас.

Спикером второго трека стал Андрей Кутузов, кандидат филологических наук, докторант Университета Осло (Норвегия). Этот курс предназначался для тех, кто уже умеет программировать и даже, возможно, хорошо владеет компьютерной лингвистикой. На этой дорожке учащиеся практиковались в автоматическом сравнении текстов на основе их семантики. 

«В 2000-х гг., благодаря алгоритму word2vec, в компьютерной лингвистике произошел переворот. Поисковые машины и программы-переводчики смогли распознавать значения слов, представленные дистрибутивными векторами. Сегодня алгоритм word2vec – это инструмент самых передовых научных разработок в области компьютерной лингвистики». Андрей Кутузов рассказал об основах использования этого алгоритма и научил решать некоторые задачи, связанные с семантикой естественного языка.

Вторую школу компьютерной лингвистики организаторы планируют посвятить машинному обучению. За новостями можно следить в группе школы.

Более подробная информация о конференции «Множественность интерпретаций» здесь.

plenary_1.jpg

Источник:

Управление стратегических коммуникаций ТюмГУ

Поделиться
Август 2018
ПН ВТ СР ЧТ ПТ СБ ВС
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

рубрики новостей

Показать / скрыть все рубрики