от Д.С. Ночевной, И.А. Бессмертный, С.В. Клименков Дата 24.12.2022
Категория: Статьи

СПЕЦИАЛЬНЫЕ ВЫРАЖЕНИЯ ДЛЯ ПОИСКА В СТРУКТУРИРОВАННОМ ТЕКСТЕ С ИСПОЛЬЗОВАНИЕМ ГРАММАТИЧЕСКИХ СВОЙСТВ

В данной статье рассматривается применение специально разработанных регулярных выражений для извлечения словоформ, а также семантических отношений, полученных из структурированных и слабоструктурированных источников, рассматриваются основные элементы семантической сети (концепты, лексемы, словоформы, отношения и атрибуты), а также основные типы связей между элементами. Новизну исследования составляет применение регулярных выражений не к символам, а к лексемам. Приводится классификация методов для автоматизированного извлечения семантических связей из текста. Представлено сравнение производительности разработанного алгоритма и утилиты «grep» с точки зрения количества квантификаторов, входящих в шаблоны для поиска.

Схожие записи

Создать комментарий