Баданина Наталья Дмитриевна (Аспирант, Российский экономический университет имени Г. В. Плеханова)
| |
Актуальность исследования обусловлена тем, что компьютерные науки за последние десять лет превратилась в область, где научная коммуникация протекает с высокой скоростью, а публикационные всплески часто совпадают с появлением прорывных результатов, будь то выход обновленных стандартов или интеграция языковых моделей в практику анализа данных. Однако в литературе по наукометрии отсутствуют стандартизированные инструменты, способные автоматически выделять такие краткосрочные аномалии и связывать их с внешними событиями. Целью настоящей работы является создание воспроизводимого пайплайна анализа временных рядов публикаций в категории компьютерных наук arXiv с целью выявления статистически значимых всплесков и их последующей интерпретации через корреляцию с внешними событиями. Методологически исследование опирается на комбинацию библиометрических и временных подходов. Результаты показали наличие двух статистически значимых всплесков. Предложенный пайплайн позволяет количественно фиксировать и объяснять аномальные всплески публикационной активности. Результаты могут использоваться для раннего выявления новых направлений исследований и ключевых исследовательских групп, что в перспективе способствует более эффективному выбору направлений научно-исследовательских и опытно-конструкторских работ.
Ключевые слова:компьютерные науки, поиск аномалий, временные ряды, arima, статистические методы.
|
|
| |
|
Читать полный текст статьи …
|
Ссылка для цитирования: Баданина Н. Д. МЕТОДЫ ОБРАБОТКИ ДАННЫХ ДЛЯ АНАЛИЗА ПУБЛИКАЦИОННОЙ АКТИВНОСТИ В ОБЛАСТИ КОМПЬЮТЕРНЫХ НАУК // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2025. -№10/2. -С. 12-16 DOI 10.37882/2223-2966.2025.10-2.01 |
|
|