收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于聚类分析策略的Web文本挖掘方法

刘彦保  王文发  王文东  
【摘要】:在分析Web文本挖掘过程、关键技术的基础上,针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的Web文本挖掘方法。其基本思路是对训练文档集进行聚类处理,然后对同主题文档进行共性分析,并经过特征权值调整和特征约减,从而获得表示用户不同主题感兴趣概念向量。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 石福斌;;一种基于多Agent技术的Web挖掘模型及应用[J];信息技术;2007年06期
2 杨小云;数字图书馆中数据挖掘研究[J];延安教育学院学报;2005年02期
3 王圆;孙铁利;李杨;;Web文本挖掘中的特征表示和特征提取[J];电脑知识与技术(学术交流);2006年14期
4 许高建;;基于Web的文本挖掘技术研究[J];计算机技术与发展;2007年06期
5 韩春;田大钢;;对股票市场信息的文本挖掘[J];中国高新技术企业;2008年23期
6 黄鲁成;赵盼;;关于采用Web挖掘方法分析技术发展趋势的思考[J];科技管理研究;2010年21期
7 张宏松;刘建辉;;面向Web的文本信息挖掘研究[J];计算机系统应用;2006年09期
8 曹棣;孔晓斌;;基于粗糙k-均值的web事务的聚类[J];山西师范大学学报(自然科学版);2011年02期
9 何典;宋中山;梁英;;结合用户交易情况的改进聚类算法[J];计算机应用与软件;2007年11期
10 邓英,李明;Web数据挖掘技术及工具研究[J];计算机工程与应用;2001年20期
11 王艳;数据挖掘在数字图书馆中的应用[J];现代图书情报技术;2002年05期
12 伍东;李建;吴波;;基于聚类分析策略生成动态网页链接[J];现代电子技术;2006年21期
13 赵晓静;;Web文本挖掘综述[J];电脑学习;2008年05期
14 张涛;邓军;;现代远程教育个性化Web挖掘研究[J];科学技术与工程;2007年05期
15 史嘉陵;;数据挖掘在数字图书馆个性化服务中的应用[J];农业网络信息;2009年04期
16 万红新;彭云;;模糊策略下的搜索文本聚类分析技术[J];计算机工程与应用;2009年33期
17 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
18 朱东华;荆雷;徐建国;;计算机前沿技术在科技管理领域的应用研究[J];科技进步与对策;2003年09期
19 李颖,阎保平;Web文本挖掘在互联网信息统计中的研究与设计[J];微电子学与计算机;2005年01期
20 赵卫军;;数据挖掘技术在高校图书馆中的应用[J];图书馆论坛;2007年04期
中国重要会议论文全文数据库 前10条
1 忻雅;王伟科;阮松林;王世恒;马华升;;基于RAPD和EST-SSR标记的秀珍菇菌株聚类分析[A];中国菌物学会第四届会员代表大会暨全国第七届菌物学学术讨论会论文集[C];2008年
2 鲁振华;宋银花;牛良;刘淑娥;王志强;;PermutMatrix软件及其在观赏桃形态性状聚类分析中的应用[A];中国园艺学会桃分会第二届学术年会论文集[C];2009年
3 马汉武;郭沛尧;;基于供应链的供应商分类模型及其管理策略研究[A];现代工业工程与管理研讨会会议论文集[C];2006年
4 张凤兰;郝丽珍;王萍;杨忠仁;王六英;张进文;;蒙古高原特有属——沙芥属蔬菜植物果实和种子形态指标聚类分析[A];中国园艺学会第七届青年学术讨论会论文集[C];2006年
5 李国良;李忠富;;基于聚类的企业绩效熵值评价方法研究[A];第十一届中国管理科学学术年会论文集[C];2009年
6 高林;刘喜梅;;多模型中权值确定的新方法及其应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
7 杨欣斌;黄道;;一种新的聚类算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 曾志锋;张玉霞;韦群;;鳄蜥的生境选择[A];中国动物学会两栖爬行动物学分会2005年学术研讨会暨会员代表大会论文集[C];2005年
9 房海灵;李维林;于盱;梁呈元;;薄荷属植物的数量分类[A];中国植物学会植物结构与生殖生物学专业委员会、江苏省植物学会2007年学术年会学术报告及研究论文集[C];2007年
10 金友玉;;湖北省区域经济差异综合评价及分类分析[A];2007中国科协年会专题论坛暨第四届湖北科技论坛优秀论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 赵宁;理中丸和四君子汤与脾虚证方证相关性的实验研究[D];中国中医科学院;2006年
2 曹锋;数据流聚类分析算法[D];复旦大学;2006年
3 吕崇山;代谢综合征中医辨证分型及其与临床检测指标的相关性研究[D];福建中医学院;2008年
4 袁军宝;我国农业现代化进程中的农户兼业经营问题研究[D];兰州大学;2009年
5 邵伟钰;地方政府债务风险预警体系研究[D];苏州大学;2008年
6 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
7 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
8 戴维迪;非监督知识发现过程中若干关键问题研究[D];天津大学;2005年
9 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
10 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 王会芬;基于Web的网页聚类系统的研究与实现[D];天津大学;2005年
2 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
3 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
4 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
5 崔鹏;一种基于支持向量机的直推式WEB挖掘[D];大连海事大学;2006年
6 张兆中;WEB文本挖掘的聚类分析[D];山东科技大学;2005年
7 杨占华;聚类分析研究及其在文本挖掘中的应用[D];西南交通大学;2006年
8 闫雷;急性白血病相关基因的文本挖掘分析[D];中国医科大学;2006年
9 刘静;基于Web文本挖掘的SVM网页文本分类研究[D];东北财经大学;2006年
10 田地;基于电子商务Web的数据挖掘技术研究[D];郑州大学;2006年
中国重要报纸全文数据库 前10条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
4 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
5 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
6 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
7 汪洋 编译;BI平民化[N];计算机世界;2004年
8 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
9 靳辉;垂直搜索:呼叫经济发展的核心动力[N];通信产业报;2007年
10 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978