Login

Журнал «Современная Наука»

Russian (CIS)English (United Kingdom)

МОСКВА +7(495)-755-19-13

Статьи:
A+ R A-

Кластеризация документов на основе онтологии

E-mail Печать

Нэй Лин,  (Аспирант, Курский государственный университет)

Серия «Естественные и Технические науки» # 09  2017
В статье анализируется один из способов кластеризации документов. Определяются подходы к реализации этого способа. Кластеризация текста традиционными методами осуществляется на основе синтаксический информации, а не семантической информации. Поэтому система кла-стеризации не понимает значение слов, и при этом в документах имеются си-нонимы и полисемии. Но здесь существуют и другие проблемы, которые приводят к потере данных и ошибкам в информации. Когда осуществляется замена онтологией одинаковых семантически слов, возникает вероятность потери данных.

Ключевые слова: Кластеризация, онтология, поиск, семантический вес.

 

Читать полный текст статьи …


СПИСОК ЛИТЕРАТУРЫ:
1. Hotho, A., Staab, S.andStumme, G. 2003. Wordnet improves text document clustering. In Proceedings of Semantic Web Work-shop, the 26th annual International ACM SIGIR Conference. (Toronto, Canada, Jul. 28-Aug.1, 2003)
2. Hotho, A., Maedche, A. and Staab, S. Text Clustering Based on Good Aggregations, In Proceedings of the 2001 IEEE International Conference on Data Mining. (San Jose, CA, Nov. 29-Dec.02, 2001,). IEEE Computer Society, Washington, DC, 07-608.
3. Yoo, I., Hu, X. and Song, I.-Y. 2006. Integration of semantic-based bipartite graph representation and mutual refinement strategy for biomedical literature clustering. In Proceedings of the 12th ACM SIGKDD international conference on Knowledge dis-covery and data mining. (Philadelphia, PA, August 20 – 23, 2006). ACM Press, New York, NY, 791 – 796.
4. Zhang, X., Jing, L., Hu, X., et al. A Comparative Study of Ontology Based Term Similarity Measures on Document Cluster-ing. In Proceedings of 12th International conference on Database Systems for Advanced Applications. (Bangkok, Thailand, April 9-12, 2007).115-126.
5. G. Salton, “The SMART Retrieval System Experiments in Automatic Document Retrieval”, New Jersey, Englewood Cliffs: Prentice Hall Inc., 1971.
6. G. Salton and C. Buckley, “Term-Weighting Approach in Automatic Text Retrieval,” Information Processing & management, vol. 24,no. 5, 1988, pp. 513-523.
7. Xiaohua.Hu, Xiaodan.Zhang, Caimei.Lu, Xiaohua.Zhou, “Exploiting Wikipedia as External Knowledge for Document Clus-tering” , KDD’09, June 28-July 1,
8. L. Jing, M. K. Ng, J. Xu and Z. Huang, “Subspace clustering of text documents with feature weighting k- means algorithm, Proc.of PAKDD, pp. 802-812,2005.
9. HmwayHmway Tar and ThiThiSoeNyunt, “Ontology-Based Concept Weighting for Text Documents”, 2011 International Conference on InformationCommunication and Management IACSIT Press, Singapore.
10. Ahmed Sameh, Amar Kadray, “Semantic Web Search Results Clustering Using Lingo and WordNet”, InternationalJournal of Research and Reviews in Computer Science (IJRRCS) Vol. 1, No. 2, June 2010.
11. Zeng, Hua-Jun, Qi-Cai He, Zheng Chen, Wei-Ying Ma, and Jinwen Ma. "Learning To Cluster Web Search Re-sults”,SIGIR'04, July 2004, Sheffield, South Yorkshire, UK.
12. RekhaBaghel, RenuDhir, “Text Document Clustering Based on Frequent Concepts”, 2010 1st International Conference on Parallel, Distributed and Grid Computing (PDGC - 2010).
13. Rakesh Agrawal and Ramakrishnan Srikant, “Fast algorithms for mining association rules”. In Jorge B. Bocca,Matthias Jarke, and Carlo Zaniolo, editors,Proc 20th Int. Conf. Very Large Data Bases, VLDB, pp.487–499, 1994.
14. Imielinski, and A. N. Swami, “Mining Association rules between sets of items in large databases”. In Proceedings of ACMSIGMOD International Conference onManagement of Data (SIGMOD93), pp.207–216, Washington, D.C., May 1993.



© 
Нэй Лин, Журнал "Современная наука: актуальные проблемы теории и практики".
 

 

 

ПРАВОВАЯ ИНФОРМАЦИЯ:
Перепечатка материалов допускается только в некоммерческих целях со ссылкой на оригинал публикации. Охраняется законами РФ. Любые нарушения закона преследуются в судебном порядке.
© ООО "Научные технологии"

Серия - Естеств. и Техн. науки

Выпуск 2017 10 Natural and Technical

Выпуск 2017 09 Natural and Technical

Выпуск 2017 7-8(1) Natural and Technical

Выпуск 2017 7-8(2) Natural and Technical

Выпуск 2017 06 Natural and Technical

Выпуск 2017 05 Natural and Technical

Выпуск 2017 03-04 Natural and Technical

Выпуск 2017 02 Natural and Technical

Выпуск 2017 01 Natural and Technical

Выпуск 2016 12 Natural and Technical

Выпуск 2016 11 Natural and Technical

Выпуск 2016 09-10 Natural and Technical

Выпуск 2016 08 Natural and Technical

Выпуск 2016 07 Natural and Technical

Выпуск 2016 06 Natural and Technical

Выпуск 2016 05 Natural and Technical

Выпуск 2016 04 Natural and Technical

Выпуск 2016 03 Natural and Technical

Выпуск 2016 02 Natural and Technical

Выпуск 2016 01 Natural and Technical

Выпуск 2015 13 Natural and Technical

Выпуск 2015 12(1) Natural - Technical

Выпуск 2015 12(2) Natural and Technical

Выпуск 2015 11(1) Natural and Technical

Выпуск 2015 11(2) Natural and Technical

Выпуск 2015 09-10 Natural and Technical

Выпуск 2015 07-08 Natural and Technical

Выпуск 2015 05-06 Natural and Technical

Выпуск 2015 03-04 Natural and Technical

Выпуск 2015 01-02 Natural and Technical

Выпуск 2014 11-12 Natural and Technical

Выпуск 2014 09-10 Natural and Technical

Выпуск 2014 07-08 Natural and Technical

Выпуск 2014 05-06 Natural and Technical

Выпуск 2014 03-04 Natural and Technical

Выпуск 2014 01-02 Natural and Technical

Выпуск 2013 11-12 Natural and Technical

Выпуск 2013 9-10 Natural and Technical

Выпуск 2013 7-8 Natural and Technical

Выпуск 2013 5-6 Natural and Technical

Выпуск 2013 3-4 Natural and Technical

Выпуск 2013 1-2 Natural and Technical

Выпуск 2012 12 Natural and Technical

Выпуск 2012 10-11 Natural and Technical

Выпуск 2012 8-9 Natural and Technical

Выпуск 2012 6-7 Natural and Technical

Выпуск 2012 4-5 Natural and Technical

Выпуск 2012-03 Natural and Technical

Выпуск 2012-02 Natural and Technical

Выпуск 2012-01 Natural and Technical

Выпуск 01-2011 Natural and Technical