收藏本站
《计算机研究与发展》 2006年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于分级神经网络的Web文档模糊聚类技术

雷景生  马军  靳婷  
【摘要】:给出了一种多层向量空间模型,该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重.然后提出了一种简明而有效的基于分级神经网络的模糊聚类算法.与现有方法不同,该模糊聚类方法采用自组织神经网络和模糊聚类网络两部分组成的3层神经网络来实现.首先采用自组织神经网络从原始数据产生一个初始聚类结果,然后运用FCM方法对初始聚类的数目进行优化.实验结果表明,提出的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的Web文档较完全和准确地聚成一类.

【参考文献】
中国期刊全文数据库 前1条
1 于剑;论模糊C均值算法的模糊指标[J];计算机学报;2003年08期
【共引文献】
中国期刊全文数据库 前10条
1 李翠霞,于剑;一种模糊聚类算法归类的研究[J];北京交通大学学报;2005年02期
2 张晓辉,李莹,王华勇,赵宏;应用特征聚合进行中文文本分类的改进KNN算法[J];东北大学学报(自然科学版);2003年03期
3 张莉,康耀红,王曙光,张春元;中文网页自动分类现状的研究[J];福建电脑;2004年05期
4 唐懿芳 ,牛力 ,傅赛香 ,严小卫;文本的自动分类[J];广西师范大学学报(自然科学版);2001年04期
5 王灏,黄厚宽,田盛丰;文本分类实现技术[J];广西师范大学学报(自然科学版);2003年01期
6 许增福,梁静国,田晓宇;基于FVSM和自组织映射网络的Web文本自动分类方法[J];哈尔滨工业大学学报;2004年09期
7 李宝林,张翼英,兰芸;用关联分析技术识别不良信息特征项的新方法[J];计算机工程与应用;2003年28期
8 陈昊,王熙照,袁方,湛燕;Lazy和Eager分类算法的比较研究[J];计算机工程与应用;2004年04期
9 杨创新,彭宏,杨沛;一种基于主题树模型的Web主题检索算法[J];计算机工程与应用;2004年16期
10 徐凤亚,罗振声;文本自动分类中特征权重算法的改进研究[J];计算机工程与应用;2005年01期
中国重要会议论文全文数据库 前2条
1 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 卢朋;曾隽芳;杨一平;;基于背景知识的文本自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
2 刘蓉;基于聚类算法的多属性复杂大群体决策方法研究[D];中南大学;2006年
3 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
4 王璐;未知环境中移动机器人视觉环境建模与定位研究[D];中南大学;2007年
5 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
6 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
7 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
8 刘仁金;基于商空间的纹理图象分割研究[D];安徽大学;2005年
9 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
10 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 钟平;数据挖掘在火力发电厂中的应用研究[D];国防科学技术大学;2006年
2 孙登林;基于概念网的不良信息过滤研究与实现[D];上海交通大学;2008年
3 刘石竹;基于句子级频繁项目集的文本分类方法研究[D];华中科技大学;2006年
4 刘洋;最优搜索理论与支持向量机在信息检索中的应用研究[D];电子科技大学;2007年
5 朱强;粒度计算在聚类分析中的应用[D];安徽大学;2007年
6 陈骏;基于语义网的文本信息分类技术研究[D];南京理工大学;2006年
7 张宏;基于本体的农业自动应答系统关键技术研究[D];河北农业大学;2007年
8 李慧娟;基于粗糙集的文本分类算法研究[D];东北师范大学;2007年
9 吕文志;基于分类和关联规则的数据挖掘研究及应用[D];大连理工大学;2001年
10 王汉萍;粗糙集理论在文本挖掘的分类算法中的应用研究[D];中国海洋大学;2003年
【同被引文献】
中国期刊全文数据库 前1条
1 徐炳吉,廖晓昕,刘新芝;二阶神经网络的全局指数稳定性分析[J];计算机研究与发展;2002年09期
【二级参考文献】
中国期刊全文数据库 前1条
1 高新波,谢维信;模糊聚类理论发展及应用的研究进展[J];科学通报;1999年21期
【相似文献】
中国期刊全文数据库 前10条
1 韦秀先;李正吾;;情报检索向量空间模型的几点补充[J];技术与市场;1993年02期
2 陶跃华,王锡钢,王云爱;信息检索向量空间模型中特征提取的研究[J];云南师范大学学报(自然科学版);2000年06期
3 王文欣,黄萱菁,吴立德;基于统计方法的汉语自动文摘系统研究[J];计算机应用与软件;2000年09期
4 朱华宇,孙正兴,张福炎;一个基于向量空间模型的中文文本自动分类系统[J];计算机工程;2001年02期
5 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
6 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
7 陈治平,林亚平,童调生;基于N层向量空间模型的信息检索算法[J];计算机研究与发展;2002年10期
8 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期
9 游荣彦,邓志才,李传宏;向量空间模型中特征词的区分度的定量研究[J];中文信息学报;2002年03期
10 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
中国重要会议论文全文数据库 前10条
1 万敏;罗振声;郭玉箐;;自动文摘系统中的意义段划分问题研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 王慧玲;宋柔;戴伟长;;汉语文本按语体分类的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 张刚;刘挺;秦兵;车万翔;李生;;面向信息内容安全的文本过滤系统研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 卜东波;白硕;;文摘自动生成中权重计算的对偶性策略[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
8 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
9 苏贵洋;王永成;马颖华;;信息自动获取的结构模型[A];第一届学生计算语言学研讨会论文集[C];2002年
10 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前2条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
4 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
5 王修力;基于描述复杂性的信息检索理论与若干模型研究[D];北京语言大学;2006年
6 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
7 杨志峰;稳定的信息检索方法及其在分布式环境下的应用[D];中国科学院研究生院(计算技术研究所);2003年
8 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
9 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
10 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 任美睿;数字图书馆中词频提取和自动文本分类方法的研究[D];黑龙江大学;2002年
2 董建设;基于HTML标记分析及中文切词的网页索引研究与实现[D];兰州理工大学;2003年
3 郭永明;XML文档检索技术研究[D];太原理工大学;2003年
4 李正林;中文文本数据分类研究[D];上海师范大学;2004年
5 骆昌日;基于统计方法的中文文本自动分类研究[D];华中师范大学;2004年
6 陈晋川;基于CoP建模的信息过滤技术研究[D];中国科学院研究生院(软件研究所);2004年
7 方兰;基于局域网的信息推送系统[D];江西师范大学;2004年
8 张隽;模糊同义词典在VSM文本信息检索方法中的应用[D];大连理工大学;2004年
9 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
10 蒋伟贞;基于类别的特征选择算法的文本分类系统[D];西南交通大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026