В ТюмГУ разрабатывают программу для автоматического построения информационных портретов
Проект поддержан грантом Российского фонда фундаментальных исследований.
Cотрудница кафедры программного обеспечения ТюмГУ Анна Глазкова разрабатывает программу, которая будет извлекать биографические факты из интернет-текстов и автоматически строить информационные портреты.
«Сегодня информационный поиск в электронных ресурсах связан с рядом сложностей. Так, исследователь не всегда может четко сформулировать поисковый запрос. Кроме того, ряд биографических фактов находится в тексте в неявном виде, — объяснила она. — Это вынуждает просматривать большие объемы текстовой информации в поисках значимых для исследования фактов. В том числе в разных по структуре материалах. И если извлечение фактов из резюме легко поддается автоматизации, то обработка текстов, не имеющих регламентированной структуры, требует дополнительной работы».
В описании проекта разработчик будет использовать понятие информационного портрета личности.
По мнению А. Глазковой, программа будет полезна ученым, которые занимаются биографическими исследованиями и другим пользователям в связи с увеличением объема информации в хранилищах электронных документах.
Проект тюменки «Автоматизированное извлечение биографических фактов из текстов на естественном языке» поддержан грантом Российского фонда фундаментальных исследований.
Источник:
Управление стратегических коммуникаций ТюмГУ
«Сегодня информационный поиск в электронных ресурсах связан с рядом сложностей. Так, исследователь не всегда может четко сформулировать поисковый запрос. Кроме того, ряд биографических фактов находится в тексте в неявном виде, — объяснила она. — Это вынуждает просматривать большие объемы текстовой информации в поисках значимых для исследования фактов. В том числе в разных по структуре материалах. И если извлечение фактов из резюме легко поддается автоматизации, то обработка текстов, не имеющих регламентированной структуры, требует дополнительной работы».
В описании проекта разработчик будет использовать понятие информационного портрета личности.
По мнению А. Глазковой, программа будет полезна ученым, которые занимаются биографическими исследованиями и другим пользователям в связи с увеличением объема информации в хранилищах электронных документах.
Проект тюменки «Автоматизированное извлечение биографических фактов из текстов на естественном языке» поддержан грантом Российского фонда фундаментальных исследований.
Источник:
Управление стратегических коммуникаций ТюмГУ
Рубрики:
Теги:
Читайте также