Журнал «Современная Наука»

Russian (CIS)English (United Kingdom)
МОСКВА +7(495)-142-86-81

Анализ технологии классификации текста

Чжэн Цзини   (МГТУ им. Н.Э. Баумана)

Вэй Сяоюй   (МГТУ им. Н.Э. Баумана)

В статье дается обзор основных подходов к анализу текстовой информации. Особое внимание уделяется технологиям TextMining и мешка (или облака) слов. Рассмотрен алгоритм комплексной классификации текстов. Описывается программное решения построения семантического ядра текста на языке Python на базе библиотеки collections.

Ключевые слова:классификация текстов, семантическое ядро, признаки документов, ключевые фразы, дистрибутивная семантика, text mining, мешок (или облако) слов.

 

Читать полный текст статьи …



Ссылка для цитирования:
Чжэн Ц. , Вэй С. Анализ технологии классификации текста // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2022. -№03/2. -С. 58-61 DOI 10.37882/2223-2966.2022.03-2.18
ПРАВОВАЯ ИНФОРМАЦИЯ:
Перепечатка материалов допускается только в некоммерческих целях со ссылкой на оригинал публикации. Охраняется законами РФ. Любые нарушения закона преследуются в судебном порядке.
© ООО "Научные технологии"