ТЕМАТИЧЕСКИЕ МОДЕЛИ КАК ИНСТРУМЕНТ «ДАЛЬНЕГО ЧТЕНИЯ»

doc ТЕМАТИЧЕСКИЕ МОДЕЛИ КАК ИНСТРУМЕНТ «ДАЛЬНЕГО ЧТЕНИЯ»

Статья представляет собой обзор подходов к тематическому моделированию – современному направлению исследования больших текстовых коллекций. В настоящее время сверхвысокие темпы накопления информации приводят к тому, что при изучении той или иной темы пользователю становится все труднее разобраться в исследуемом предмете. Таким образом, актуальным вопросом является смысловая компрессия информации – своего рода «дальнее чтение» – необходимое условие получения знаний в условиях стремительного разрастания доступного объема информации. «Дальнее чтение» может быть реализовано с помощью тематического моделирования –направления, находящегося на стыке компьютерной лингвистики и машинного обучения и призванного определять структуру коллекции текстовых документов путем выявления скрытых тем в документах, а также термов (слов или словосочетаний), характеризующих каждую из тем.

«Мы умеем читать тексты,
теперь нужно научиться не читать их»
Ф. Моретти
pdf
Имя файла: DE-2019-01-06
Размер файла: 1.7 mb
Скачать файл

Идентификаторы статьи

  • 10.34706/DE-2019-01-06

Читайте также:

 

Комментарии

Нет комментариев. Будь первым, кто оставит комментарий.
Уже зарегистрированы? Войти на сайт
21.11.2024

Подождите минутку, пока генерируется календарь