专利内容由知识产权出版社提供
专利名称:基于模糊聚类的网络文本数据检测方法专利类型:发明专利
发明人:赵安军,王磊,王礼,杨宗良申请号:CN200910219439.2申请日:20091210公开号:CN101763404A公开日:20100630
摘要:本发明公开了一种基于模糊聚类的网络文本数据检测方法,先对提取的网络内容进行预处理;对需要聚类的预处理后网络内容进行特征提取后对网络内容进行聚类,设定初始聚类数。在聚类过程中,一个聚类数对应一个隶属度矩阵,每个隶属度矩阵都有一个平均信息熵值,平均信息熵基于密度函数选择初始聚类中心,算法迭代过程中修改聚类数,当平均信息熵达到最小值时,所对应的聚类数为最佳聚类数。最后将聚类结果返回给用户。本发明具有高效的智能聚类效果,并且可以根据应用的不同,调整聚类的精度,兼顾聚类的速度。
申请人:陕西鼎泰科技发展有限责任公司
地址:710072 陕西省西安市科技路30号合力紫郡大厦B-2001室
国籍:CN
代理机构:西北工业大学专利中心
代理人:顾潮琪
更多信息请下载全文后查看