В данной статье рассматривается применение специально разработанных регулярных выражений для извлечения словоформ, а также семантических отношений, полученных из структурированных и слабоструктурированных источников, рассматриваются основные элементы семантической сети (концепты, лексемы, словоформы, отношения и атрибуты), а также основные типы связей между элементами. Новизну исследования составляет применение регулярных выражений не к символам, а к лексемам. Приводится классификация методов для автоматизированного извлечения семантических связей из текста. Представлено сравнение производительности разработанного алгоритма и утилиты «grep» с точки зрения количества квантификаторов, входящих в шаблоны для поиска.
Комментарии