Капитанов  Андрей Иванович   (Ассистент, Национальный исследовательский университет «МИЭТ»)
                
            
            
                Трояновский  Владимир Михайлович   (Д.т.н., профессор, Национальный исследовательский университет «МИЭТ»)
                
            
            
    
        
            
            
                
                    
                        |   | 
                        
                         При решении задачи кластеризации контекстов возникает проблема автоматического определения количества кластеров. Кластеризация контекстов позволяет эффективно разрешать проблему омонимии, что в свою очередь приводит к повышению качества ряда задач компьютерной лингвистики. На примере задачи классификации текстовых документов мы попытаемся вычислить необходимое количество кластеров для повышения доли распознанных документов. В ходе работы на основе плотностного алгоритма DBSCAN нам удалось вычислить количество кластеров, далее на основе агломеративной иерархической кластеризации разбить омонимичные контексты на кластеры и снять омонимию. После этого мы проверили качество классификации на основе алгоритма наивного байесовского классификатора и убедились в увеличении доли верно распознанных документов. 
                        Ключевые слова:иерархическая кластеризация, кластерный анализ, классификация, полисемия, DBSCAN. 
                         | 
                     
                
             
             | 
        
        
            |   | 
        
        
            | 
             Читать полный текст статьи …  
             | 
        
        
             
             
            
                
                    
                         Ссылка для цитирования: Капитанов  А. И., Трояновский  В. М. Проблема автоматического определения количества кластеров в задаче кластеризации контекстов // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2020. -№06. -С. 100-104 DOI 10.37882/2223-2966.2020.06.19 | 
                         | 
                     
                
             
             |