Гуманитарную цифру изучают в ТюмГУ
3 апреля в Институте социально-гуманитарных наук пройдет первый дататон: соревнование по анализу данных. В программе — интенсив по работе на языке программирования R, генерация идей и попытка написать код для решения одной из трех предложенных организаторами задач. Идейные вдохновители датотона: Елена Михалькова — кандидат филологических наук, магистр информатики, и Анастасия Башмакова — ассистент кафедры английской филологии и перевода.
Применение компьютерных методов в социальных и гуманитарных исследованиях называется цифровой гуманитаристикой. Один из ее примеров — проект Высшей школы экономики «Имена времени». Исследователи проанализировали Национальный корпус русского языка и выделили эпитеты, которые применяются к разным десятилетиям: например, «лихие» девяностые или «романтические» шестидесятые. В основе проекта лежит метод культуромики — статистический анализ употребления слов и словосочетаний в больших коллекциях текстов, который в данном контексте позволяет определить культурные тренды разных времен.
«Цифровые инструменты могут стать неотъемлемой частью научных работ филологов, лингвистов, журналистов или антропологов. С их помощью автоматически обрабатываются массивы информации. По результатам анализа мы можем сделать выводы, которые даже не рассматривались на моменте построения гипотезы. Существует стереотип, что компьютерные методы — это сложно: гуманитарии часто не уверены в своих силах, но это не так. Не обязательно глубинно понимать, что и как работает: есть огромное количество готовых решений. Как будто просто собираем пазл. В конце концов, мы уже освоили самые простые инструменты и изучаем наборы данных в текстовых и табличных редакторах», — отмечает Анастасия Башмакова.
Елена Михалькова пояснила: «В компьютерной среде очень много терминов. Нужно сквозь них пробраться. Тогда вы увидите, что в основном используются самые простые операции, знакомые любому школьнику: сложение, вычитание, умножение и деление. Что-то более сложное встречается очень редко. Сейчас повсеместным становится тренд ZeroСode, когда разработчики дают готовые IT-решения. Визуально они выглядят как графические блоки, связанные между собой — буквально стрелочки и квадрики. Такой инструмент позволяет создавать ботов, просто вписав внутри блоков фразы и варианты ответа на них. Например, любой человек может воспользоваться бесплатной версией платформы Just AI, чтобы развить навык у Алисы или запустить чат-бот в Телеграмме».
Чуть более продвинутые пользователи пробуют создать себе в помощь искусственный интеллект. Разработка нейросети, применяемой в социальных и гуманитарных исследованиях, само по себе является нетривиальной задачей. Требуется не столько умение использовать цифровые инструменты, сколько навык находить ключевые признаки и связывать их в систему, благодаря которой искусственный интеллект способен быстро и точно выполнять свои функции — например, давать ответы на вопросы. Обучение нейросети происходит в две фазы: сначала ей «скармливают» много информации — на ее основе формируются закономерности, а затем приступают к тестированию. Оно выполняется с помощью уникального набора вопросов.
«В августе 2021 года закончилась моя переподготовка по компьютерной лингвистике в Высшей школе экономики. Практику проходила в Сбере. Я занималась обучением модели вопросам школьной программы в рамках проекта Russian SuperGLUE, то есть General Language Understanding — понимание естественного языка. Последние тесты, которые проходили люди и комплекс разработанных в Сбере систем, показали, что искусственный интеллект ошибается меньше. На вопросы типа „Тигр — это хищное животное?“ система выдавала 98% правильных ответов, а человек — 88%», — рассказала Анастасия Башмакова.
Обучение цифровых систем остается общемировым трендом. Их используют и в гуманитарных исследованиях, и в индустриях, и в повседневной жизни. Однако развитие технологий ставит новые вопросы:
Как искусственный интеллект должен находить правильные ответы при условии существования десятков вариантов постановки одного вопроса?
Как научить его отличать факт от фейка?
Как добиться того, чтобы голосовой помощник мог действительно помогать, а не водить по ограниченному кругу заданных функций?
И наконец, если нейросети становятся лучше и в чем-то могущественнее человека, как определить правильность их суждений и ценностных установок?
Справка
Мероприятие пройдет 3 апреля в 501 аудитории Института социально-гуманитарных наук ТюмГУ (г. Тюмень, ул. Ленина, 23). Участникам не из ТюмГУ необходимо заранее прислать ФИО.
Дедлайн подачи заявок: 27 марта.
Подробности и форма регистрации здесь.
Источник:
Управление стратегических коммуникаций ТюмГУ
Источник фото: Яндекс.Картинки