Журнал «Современная Наука»

Russian (CIS)English (United Kingdom)
МОСКВА +7(495)-142-86-81

АНАЛИЗ СОВРЕМЕННЫХ ФУНДАМЕНТАЛЬНЫХ АРХИТЕКТУРНЫХ ПОДХОДОВ И МЕТОДОВ ОБУЧЕНИЯ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ: ОТ ТРАНСФОРМЕРНОЙ РЕВОЛЮЦИИ К НОВОЙ ПАРАДИГМЕ ЭФФЕКТИВНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Белов Вячеслав Викторович  (Аспирант, Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации)

Никишов Сергей Иванович  (д.э.н., доцент, Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации Москва, Россия )

Статья представляет собой комплексный анализ современного состояния исследований в области больших языковых моделей (Large Language Models, LLM). Рассматривается эволюция фундаментальных архитектурных решений от классического трансформера до современных специализированных подходов: декодер-моделей с эффективными механизмами внимания, смешанных экспертных систем (Mixture of Experts) и мультимодальных архитектур. Детально анализируются современные методы обучения, включая оптимальное масштабирование согласно закону Чинча, передовые подходы к курированию обучающих данных, методы выравнивания с человеческими предпочтениями (RLHF, DPO) и эффективные стратегии тонкой настройки (PEFT, LoRA). Выявляются ключевые тренды: переход от экстенсивного увеличения параметров к интеллектуальному проектированию архитектур, демократизация доступа через открытые модели и сдвиг в сторону создания мультимодальных систем нового поколения. Особое внимание уделяется перспективным направлениям исследований, включая модели с состоянием (State-Space Models) для бесконечного контекста и гибридные архитектуры.

Ключевые слова:большие языковые модели, архитектура трансформера, смешанные эксперты, мультимодальное обучение, выравнивание ИИ, эффективная тонкая настройка, длинный контекст, открытые модели

 

Читать полный текст статьи …



Ссылка для цитирования:
Белов В. В., Никишов С. И. АНАЛИЗ СОВРЕМЕННЫХ ФУНДАМЕНТАЛЬНЫХ АРХИТЕКТУРНЫХ ПОДХОДОВ И МЕТОДОВ ОБУЧЕНИЯ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ: ОТ ТРАНСФОРМЕРНОЙ РЕВОЛЮЦИИ К НОВОЙ ПАРАДИГМЕ ЭФФЕКТИВНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2026. -№02. -С. 17-22 DOI 10.37882/2223-2966.2026.02.02
ПРАВОВАЯ ИНФОРМАЦИЯ:
Перепечатка материалов допускается только в некоммерческих целях со ссылкой на оригинал публикации. Охраняется законами РФ. Любые нарушения закона преследуются в судебном порядке.
© ООО "Научные технологии"