11-16 июля 2022 в рамках Конференции пройдет Четвертая открытая школа компьютерной лингвистики в ТюмГУ. Занятия проводятся по двум направлениям.
Алексей Сорокин (кандидат физико-математических наук, МГУ им. Ломоносова, Research at Yandex)
“Трансформеры: архитектура нейронной сети”
В 2017 компания Google представила свою разработку - нейронную сеть нового типа: трансформер. Эта сеть успешно справляется с такими задачами, как генерация текста, ответы на вопросы, оценка тональности, и во многих из них до сих пор не знает конкурентов. На этой технологии основана языковая модель под названием BERT, разработанная Якобом Девлином и его коллегами в Google, а также GPT от компании OpenAI. В 2020 группа исследователей под руководством Татьяны Шавриной (Сбер) представила GPT-3: модель для русского языка.
На летней школе в течение трех дней вы познакомитесь с основами архитектуры трансформеров на примерах обработки текста:
Для начала вспомним, что такое нейронные сети и как с их помощью обрабатывать естественный язык.
Сравним трансформеры и генеративные нейронные сети.
Узнаем, что такое “внимание” (attention) и как устроена архитектура “кодировщик-декодировщик” (encoder-decoder).
Разберемся в BERT, GPT и особенностях задачи seq2seq.
Познакомимся с проектом Russian SuperGLUE и запустим языковые модели на задачах для русского языка.
В итоге вы получите код проекта, который можно развивать для решения собственных задач.
Уровень сложности: высокий. Необходим опыт программирования на Python и понимание устройства нейронных сетей (например, если вы проходили МООКи на Coursera или OpenEdu).
Что взять с собой:
ноутбук, позволяющий wi-fi доступ в Интернет (можно будет подключиться к сети ТюмГУ);
на ноутбуке должен быть логин к аккаунту Google либо заранее установлен Jupyter Notebook;
если вы будете работать в облачной среде программирования Google Colaboratory, то на ноутбуке должен быть браузер Google Chrome.
Обучение от компании Just AI (Санкт-Петербург, Россия)
“Создание чат-ботов на платформе JAICP”
Чат-боты - это программы, имитирующие живое общение с человеком. Современные технологии позволяют создавать чат-ботов, которые могут заменить (полностью или частично) операторов колл-центра, регистраторов, секретарей, учителей, тренеров и консультантов. Компания Just AI разрабатывает готовые решения и инструменты для создания ботов любой сложности. Платформа JAICP (Just AI Conversational Platform) - это комплекс таких инструментов. Платформа сочетает блочное программирование с написанием кода на языках JavaScript и Kotlin. Доступ к JAICP производится удаленно, через браузер.
На летней школе в течение трех дней вы познакомитесь с основами разработки чат-ботов на JAICP. Вы узнаете:
что могут современные боты, с чем лучше всего справляются, какие плюсы и минусы у внедрения ботов в бизнес;
с чего начинается проект чат-бота, как строится диалог с ботом, что такое “диалоговая машина состояний”;
как создавать переменные и запоминать данные пользователя, как добавлять функции, например, подсчет суммы чека или таймер;
как интегрировать бота в разные сервисы, как хранить и получать данные;
что такое NLU - Natural Language Understanding, как искусственный интеллект помогает понять пользователей, которые общаются по-разному.
В итоге вы получите MVP чат-бота, с которым можно поговорить через Алису или в Телеграм.
Уровень сложности: средний. Будем программировать на языке JavaScript, но знать язык необязательно. Достаточно иметь общее представление о том, зачем он нужен и как работает. Вот здесь есть хороший учебник, если есть желание подготовиться.
Что взять с собой:
ноутбук, позволяющий wi-fi доступ в Интернет (можно будет подключиться к сети ТюмГУ);
на ноутбуке должен быть браузер Google Chrome, т.к. продукты Just AI лучше всего работают в нем.
1 трек
Алексей Сорокин. Кандидат физико-математических наук, старший преподаватель ОТиПЛ (отделения теоретической и прикладной лингвистики филологического факультета МГУ имени М. В. Ломоносова), автор и преподаватель курсов по компьютерной лингвистике и машинному обучению, исследователь (researcher) в Research at Yandex. Научные интересы: компьютерная лингвистика, лингвистическое моделирование, искусственный интеллект и нейронные сети, категориальные грамматики, теория формальных языков. Разрабатывает алгоритмы нейронных сетей для задач обработки естественного языка: морфологической разметки, проверки правописания, автоматического словоизменения и др. Список публикаций.
2 трек
Специалист компании Just AI (г. Санкт-Петербург). С 2011 года Just AI работает в сфере разговорного искусственного интеллекта и разрабатывает свою технологию понимания естественного языка NLU (Natural Language Understanding). Компания создает решения для бизнеса (полная автоматизация общения с клиентами) и частных разработчиков. На онлайн-конструкторе Aimylogic без использования кода можно сделать и запустить чат-бота в Телеграм за несколько минут. Just AI Conversational Platform (JAICP) - это более сложный продукт, который позволяет разрабатывать корпоративных AI-ботов, виртуальных ассистентов и навыки для них. Логика взаимодействия с чат-ботом прописывается при помощи специальных команд (язык JAICP DSL). Также можно встроить сценарий на популярном языке программирования JavaScript.
Школа открыта для всех желающих по предварительной регистрации.
Возможны две формы участия: очная и дистанционная (трансляция онлайн через Microsoft Teams). Число очных участников ограничено. Если будут ограничения в связи с пандемией, будет только дистанционный формат.
Занятия бесплатные. Тем, кто посетил все занятия, выдается сертификат участника.
В этом году мы открываем возможность получить не просто сертификат участника, а удостоверение о прохождении образовательного курса (повышение квалификации), если вы посетите все занятия и напишите финальный тест. Чтобы получить удостоверение, необходимо заключить договор до начала обучения в Центре дополнительного образования ТюмГУ. Удостоверение выдается по завершении курса.
Заявки принимаются до 7 июля 2022 (включительно).


