Журнал «Современная Наука»

Russian (CIS)English (United Kingdom)
МОСКВА +7(495)-142-86-81

ЭМБЕДДИНГИ КАК ОСНОВА АВТОМАТИЧЕСКОГО ИНДЕКСИРОВАНИЯ НАУЧНЫХ ТЕКСТОВ КЛЮЧЕВЫМИ ТЕРМИНАМИ: АЛГОРИТМИЧЕСКИЕ ОГРАНИЧЕНИЯ И СТРУКТУРНО-СЕМАНТИЧЕСКАЯ МОДЕЛЬ

Комаров Иван Дмитриевич  (Аспирант Всероссийского института научной и технической информации РАН (ВИНИТИ РАН) (Москва))

В данной статье рассматриваются особенности применения эмбеддингов в задачах автоматического индексирования научных текстов ключевыми терминами. Для анализа возможностей и ограничений эмбеддинг-ориентированных методов индексирования выделены три группы факторов: равноправие векторов, контекстная размытость, утрата структурной значимости терминов, а также предложена структурно-семантическая модель с использованием взвешенного представления терма и агрегированного вектора документа. Результаты исследования показали, что наилучшее качество и воспроизводимость индексирования достигаются при интеграции семантической близости кандидатов с учётом структуры научного текста, посредством чего обеспечивается повышение согласованности ключевых терминов в цифровых научных коллекциях.

Ключевые слова:автоматическое индексирование, эмбеддинги, ключевые термины, векторные представления, научные тексты, структурно-семантическая модель, цифровые научные коллекции. Komarov Ivan Dmitrievich Postgraduate student at the All-Russian Institute of Scientific and Technical Information of the Russian Academy of Sciences (VINITI RAS) (Moscow)

 

Читать полный текст статьи …



Ссылка для цитирования:
Комаров И. Д. ЭМБЕДДИНГИ КАК ОСНОВА АВТОМАТИЧЕСКОГО ИНДЕКСИРОВАНИЯ НАУЧНЫХ ТЕКСТОВ КЛЮЧЕВЫМИ ТЕРМИНАМИ: АЛГОРИТМИЧЕСКИЕ ОГРАНИЧЕНИЯ И СТРУКТУРНО-СЕМАНТИЧЕСКАЯ МОДЕЛЬ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2026. -№03. -С. 94-100 DOI 10.37882/2223-2966.2026.03.14
ПРАВОВАЯ ИНФОРМАЦИЯ:
Перепечатка материалов допускается только в некоммерческих целях со ссылкой на оригинал публикации. Охраняется законами РФ. Любые нарушения закона преследуются в судебном порядке.
© ООО "Научные технологии"