Комаров Иван Дмитриевич (Аспирант Всероссийского института научной и технической информации РАН (ВИНИТИ РАН) (Москва))
| |
В данной статье рассматриваются особенности применения эмбеддингов в задачах автоматического индексирования научных текстов ключевыми терминами. Для анализа возможностей и ограничений эмбеддинг-ориентированных методов индексирования выделены три группы факторов: равноправие векторов, контекстная размытость, утрата структурной значимости терминов, а также предложена структурно-семантическая модель с использованием взвешенного представления терма и агрегированного вектора документа. Результаты исследования показали, что наилучшее качество и воспроизводимость индексирования достигаются при интеграции семантической близости кандидатов с учётом структуры научного текста, посредством чего обеспечивается повышение согласованности ключевых терминов в цифровых научных коллекциях.
Ключевые слова:автоматическое индексирование, эмбеддинги, ключевые термины, векторные представления, научные тексты, структурно-семантическая модель, цифровые научные коллекции.
Komarov Ivan Dmitrievich
Postgraduate student at the All-Russian Institute of Scientific and Technical Information of the Russian Academy of Sciences (VINITI RAS) (Moscow)
|
|
| |
|
Читать полный текст статьи …
|
Ссылка для цитирования: Комаров И. Д. ЭМБЕДДИНГИ КАК ОСНОВА АВТОМАТИЧЕСКОГО ИНДЕКСИРОВАНИЯ НАУЧНЫХ ТЕКСТОВ КЛЮЧЕВЫМИ ТЕРМИНАМИ: АЛГОРИТМИЧЕСКИЕ ОГРАНИЧЕНИЯ И СТРУКТУРНО-СЕМАНТИЧЕСКАЯ МОДЕЛЬ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2026. -№03. -С. 94-100 DOI 10.37882/2223-2966.2026.03.14 |
|
|