|
Постановка проблемы. Несмотря на существование множества методов анализа тональности текстов, их точность и эффективность остаются недостаточно высокими для решения сложных задач, таких как анализ политических и экономических текстов, прогнозирование рыночных трендов или обеспечение безопасности. Традиционные методы, включая анализ на основе словарей (например, SentiWordNet, AFINN) и комбинированные подходы, демонстрируют ограниченную точность (72.7–78.2%), что делает их непригодными для задач, требующих высокой надежности. Кроме того, данные методы плохо справляются с обработкой контекстных зависимостей, иронии, сарказма и других сложных языковых конструкций, которые часто встречаются в текстах.
Цель. Автоматизация анализа тональности путем разработки соответствующего программного обеспечения в интересах повышения объективности исследования текстов.
Результаты. По результатам исследования разработана технология анализа тональности текстов на основе сверточных нейронных сетей (CNN), которая продемонстрировала точность 81,64%, превзойдя традиционные методы.
Практическая значимость. Практическая значимость исследования заключается в возможности повышения качества действующих систем автоматического извлечения мнений, благодаря применению технологии на основе сверточных нейросетей. Эти данные могут применяться в системах анализа тональности, агрегирующих и анализирующих данные в режиме онлайн, таких как: социальные сети, отзывы, новостные ресурсы и т.д. Мониторинг тональных отношений может способствовать выявлению текстов, умышленно искажающих действительность, поскольку резкое отличие в тональности пар сущностей в тексте от среднего показателя в определенный промежуток времени может свидетельствовать о представлении в тексте фактов, которые не соответствуют действительности.
Ключевые слова:Сентимент-анализ, текст, анализ тональности, автоматизация сентимент-анализа, машинное обучение, сверточные нейронные сети.
|