ТЕМАТИЧЕСКИЕ МОДЕЛИ КАК ИНСТРУМЕНТ «ДАЛЬНЕГО ЧТЕНИЯ»

doc ТЕМАТИЧЕСКИЕ МОДЕЛИ КАК ИНСТРУМЕНТ «ДАЛЬНЕГО ЧТЕНИЯ»

Статья представляет собой обзор подходов к тематическому моделированию – современному направлению исследования больших текстовых коллекций. В настоящее время сверхвысокие темпы накопления информации приводят к тому, что при изучении той или иной темы пользователю становится все труднее разобраться в исследуемом предмете. Таким образом, актуальным вопросом является смысловая компрессия информации – своего рода «дальнее чтение» – необходимое условие получения знаний в условиях стремительного разрастания доступного объема информации. «Дальнее чтение» может быть реализовано с помощью тематического моделирования –направления, находящегося на стыке компьютерной лингвистики и машинного обучения и призванного определять структуру коллекции текстовых документов путем выявления скрытых тем в документах, а также термов (слов или словосочетаний), характеризующих каждую из тем.

«Мы умеем читать тексты,
теперь нужно научиться не читать их»
Ф. Моретти
pdf
Имя файла: DE-2019-01-06
Размер файла: 1.7 mb
Скачать файл

Цифровой идентификатор статьи (DOI)

  • 10.34706/DE-2019-01-06

Читайте также:

 

Комментарии

Нет комментариев. Будь первым, кто оставит комментарий.
Уже зарегистрированы? Войти на сайт
Гость
17.02.2020

Подождите минутку, пока генерируется календарь

КОММЕНТАРИИ

Гость - Результаты прогноза Сетевые (цифровые) стратегии государственного планирования основных процессов защиты и сопровождения субъектов и объектов интеллектуальной собственности
28 января 2020
Ботуз С.П. (2019) Результаты прогноза относительного объема правовой охраны информационных (цифровых и т.п.) технологий РФ/ Центр интеллектуальных технологий экспертизы изобретений (https://www.facebook.com/groups/143647009677083/ Визуализация резуль...
Гость - «современная наука ИИ Сетевые (цифровые) стратегии государственного планирования основных процессов защиты и сопровождения субъектов и объектов интеллектуальной собственности
24 января 2020
Устоявшиеся древнегреческие термины (как, например, ἀλήθεια (истина), λόγος (логос), ἰδέα (идея), ἐπιστήμη (знание), γνῶσις (познание), διαλέγεσθαι (диалектика), ούσία (сущность), φύσɩς (физика), τὰ μετὰ τὰ φυσɩκά (метафизика), τέχνη (техника)...
Anatoly Kozyrev СТРАНИЦЫ ИСТОРИИ ГЛАВНОГО ВЫЧИСЛИТЕЛЬНОГО ЦЕНТРА ГОСПЛАНА СССР
20 января 2020
https://medium.com/cemi-ras/%D1%82%D1%80%D0%B8-%D1%83%D1%82%D0%BE%D0%BF%D0%B8%D0%B8-%D0%B8-%D0%BF%D1%80%D0%B8%D0%B7%D1%80%D0%B0%D0%BA-%D0%BA%D0%BE%D0%BC%D0%BC%D1%83%D0%BD%D0%B8%D0%B7%D0%BC%D0%B0-%D0%B7%D0%B0-%D0%BA%D1%80%D1%83%D0%B3%D0%BB%D1%8B%D0%BC...
Владимир Соколов СТРАНИЦЫ ИСТОРИИ ГЛАВНОГО ВЫЧИСЛИТЕЛЬНОГО ЦЕНТРА ГОСПЛАНА СССР
07 января 2020
Очень интересно. Надо еще сказать, что Владимир Викторович очень доброжелателен, внимателен и терпелив в личном общении (в 1993-1995 гг. работали в одном здании на Новом Арбате). Надеюсь, что мое желание воспользоваться предоставленной Вами, Анатолий...
Гость - будущее за эргатическими (человеко-машинными) системами. Сетевые (цифровые) стратегии государственного планирования основных процессов защиты и сопровождения субъектов и объектов интеллектуальной собственности
07 января 2020
https://m.hightech.plus/2020/01/07/2019-god-dlya-ii-pik-formi-ili-nachalo-zakata-neiroseteiЭкологи подсчитали, что обучение одной нейросети в 2019 году выбрасывало в атмосферу почти 300 тонн СО2, так что ИИ может погубить человечество вместо того, чт...
Anatoly Kozyrev СТРАНИЦЫ ИСТОРИИ ГЛАВНОГО ВЫЧИСЛИТЕЛЬНОГО ЦЕНТРА ГОСПЛАНА СССР
07 января 2020
https://yadi.sk/i/Upf_W6NDwuDJSQ С большим интересом прочитал, В.В. Коссова хорошо знаю, рекомендую прочесть тем, кто в самом деле хочет понять, как все было.