| |
В данной статье раскрываются особенности автоматического индексирования научных текстов ключевыми терминами на основе методов и моделей векторных представлений. В рамках анализа выделены такие классы методов, как классические векторные представления слов, контекстные векторные структуры, графово-взвешенные схемы и решения, адаптированные к специализированным корпусам, позволяющие сопоставлять смысловые элементы научных публикаций и формировать семантические описания текстов. Кроме того, рассмотрены следующие модели: предобученные языковые структуры, контекстные трансформерные архитектуры, модели векторного представления предложений и документы, а также генеративные решения типа кодировщик–декодировщик. По результатам исследования выделено четыре ключевых подхода к автоматическому индексированию научных текстов ключевыми терминами: эмбеддинг-ранжировочный, контекстно-трансформерный с разметкой последовательности, генеративный подход на основе архитектуры типа кодировщик–декодировщик и моделей большого масштаба, структурно-эмбеддинговый гибридный.
Ключевые слова:автоматическое индексирование, ключевые термины, векторные представления, методы, модели, подходы, научные тексты
|