收藏本站
《情报学报》 2002年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

网络文本数据分类技术与实现算法

李勇  桑艳艳  
【摘要】:本文主要论述网络文本数据挖掘中的文本分类技术原理、方法 ,同时给出实现文档分类和类型匹配的若干算法 ,最后介绍文本分类正确率评价指标以及网络文本数据检索系统应用实证测评分析。
【作者单位】南京大学信息管理系 南京大学计算机科学与技术系
【分类号】:G354

【引证文献】
中国期刊全文数据库 前10条
1 陈子昕;;基于SVM的文本分类系统设计与实现[J];东莞理工学院学报;2008年03期
2 张敏;;贝叶斯分类方法在个性化信息检索中的应用研究[J];电脑学习;2006年02期
3 彭耶萍;肖大光;;个性化信息检索中的文本分类方法[J];电脑知识与技术;2008年29期
4 王一蕾,林世平;Web文本挖掘三种技术的比较[J];福建电脑;2003年12期
5 庄世芳;林世平;陈旭晖;苏芳仲;;基于概念集和粗集的中文Web文本挖掘特征提取的研究[J];福建电脑;2006年02期
6 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
7 陈鑫卿,张永奎,李荣陆;一种协调的科技文献分类方法[J];计算机工程与应用;2003年26期
8 韩晓莉;李秉智;;个性化Web推荐服务研究[J];计算机科学;2006年02期
9 张敏;;基于Web的个性化信息检索关键技术研究[J];计算机时代;2006年03期
10 薛燕波;WEB文本分类技术在企业竞争情报分析中的应用[J];情报科学;2004年03期
中国重要会议论文全文数据库 前2条
1 李连;朱爱红;;降低搜索空间的多媒体信息过滤技术[A];’2004计算机应用技术交流会议论文集[C];2004年
2 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
中国博士学位论文全文数据库 前2条
1 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
2 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
中国硕士学位论文全文数据库 前10条
1 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
2 王艳;数字图书馆个性化中文文本信息服务系统研究[D];西南师范大学;2003年
3 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
4 檀林;模糊知识处理在中文文本自动分类中的应用研究[D];山西大学;2004年
5 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
6 张敏;基于Web挖掘的个性化信息检索研究[D];山东科技大学;2004年
7 胡凌;知识订阅系统中Web挖掘模块的研究[D];华中科技大学;2004年
8 王建刚;基于Multi-Agent技术的知识共享系统研究[D];天津大学;2004年
9 陈伟萍;基于语义概念的中文文本分类研究[D];燕山大学;2006年
10 甘立国;中文文本分类系统的研究与实现[D];北京化工大学;2006年
【参考文献】
中国期刊全文数据库 前4条
1 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
2 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
3 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
4 李勇;网络文本数据搜索引擎与搜索技术[J];情报理论与实践;2001年04期
【共引文献】
中国期刊全文数据库 前10条
1 李龙澍;;PROLOG线性归结的研究与设计[J];安徽大学学报(自然科学版);1997年03期
2 李建洋;倪志伟;刘慧婷;;粗糙集在CBR中的应用研究[J];安徽建筑工业学院学报(自然科学版);2006年01期
3 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
4 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
5 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
6 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期
7 钱大琳;决策支持系统的人机关系研究[J];北方交通大学学报(社会科学版);2003年02期
8 张江;李学伟;;认知模型与统一集[J];北京交通大学学报;2005年06期
9 李岩,禹海全,冯振声;基于粗集理论的规则知识获取[J];兵工自动化;2003年03期
10 金纯;浅谈计算机自然语言理解[J];浙江中医学院学报;2005年03期
中国重要会议论文全文数据库 前10条
1 王珊珊;季民;高洁;焦其松;;CBR方法在高分辨率遥感影像分类中的应用[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
2 孙波;倪文琦;温海英;廖芳;;基于CBR的智能决策支持系统模型研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
3 胥永康;岳筱玲;;浅谈网络信息挖掘应用技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 吕韶义;刘复岩;;基于决策树的规则获取[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
5 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
6 张发平;孙厚芳;程光耀;;基于相似性的轴类零件CAPP系统研究[A];成组技术与大批量定制学术研讨会论文集[C];2006年
7 许晋平;张中权;魏潮文;;单跨门式刚架设计专家系统的研究[A];第三届全国现代结构工程学术研讨会论文集[C];2003年
8 刘惠敏;张中权;;多跨门式刚架设计专家系统的研究[A];第三届全国现代结构工程学术研讨会论文集[C];2003年
9 武聪;赵鑫;;基于遗传算法的背包问题[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
10 陈颖;胡政;宋立军;罗德民;张士刚;;基于多Agent的综合故障诊断决策模型研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅱ)[C];2008年
中国博士学位论文全文数据库 前10条
1 杜曼玲;供应链过程管理的分析方法与技术实现[D];北京交通大学;2010年
2 郑军红;基于知识工程的智能夹具设计系统构建研究[D];浙江大学;2010年
3 王守宝;科技进步与经济发展的相关性研究[D];天津大学;2010年
4 蔡军;家电产品市场营销研究[D];天津大学;2010年
5 冯力;支持机械创新设计CAD方法的探索[D];西安电子科技大学;1999年
6 赵博;结构化集成调度系统理论及基于该理论的虚拟车间智能支撑平台的体系结构研究[D];大连理工大学;2000年
7 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
8 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
9 龚报钧;基于多Agent的企业信息集成理论及应用研究[D];浙江大学;2001年
10 李初民;基于网络管理数据库中性能数据的知识发现(KDD)研究[D];重庆大学;2001年
中国硕士学位论文全文数据库 前10条
1 郝慧君;CA-MARKOV模型与GIS、RS在土地利用/土地覆盖变化中的应用研究[D];华中农业大学;2010年
2 郑占;基于CA模型的城市用地扩张模拟研究[D];华中农业大学;2010年
3 万成;动态环境下的元胞遗传算法研究[D];南昌航空大学;2010年
4 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
5 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
6 杨新忠;基于案例的地理时空过程表达模型研究[D];山东科技大学;2010年
7 邱兆红;基于案例推理的建设项目咨询系统研究[D];大连理工大学;2010年
8 王伟;基于矿井自动监测与组态软件的瓦斯管理系统开发研究[D];辽宁工程技术大学;2009年
9 刘辉;基于KNN算法的中文Web文本分类技术研究[D];辽宁工程技术大学;2010年
10 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张红云,石阳,马垣;数据挖掘中聚类算法比较研究[J];鞍山钢铁学院学报;2001年05期
2 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
3 曹元大,贺海军,涂哲明;中文Web文档全文检索系统的设计及实现[J];北京理工大学学报;2002年01期
4 廖乐健,幺敬国,曹元大,李守丽;一个语义Web系统的设计与实现[J];北京理工大学学报;2004年02期
5 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
6 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
7 夏亮,郑万波,王智;包过滤系统中关键字过滤的实现及其性能分析[J];吉林大学学报(信息科学版);2003年02期
8 白同强,刘磊;语义Web的研究与展望[J];吉林大学学报(信息科学版);2004年02期
9 林鸿飞,高天,姚天顺;中文文本的可视化表示[J];东北大学学报;2000年05期
10 张晓辉,李莹,王华勇,赵宏;应用特征聚合进行中文文本分类的改进KNN算法[J];东北大学学报;2003年03期
中国博士学位论文全文数据库 前6条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 刘海峰;安全操作系统若干关键技术的研究[D];中国科学院研究生院(软件研究所);2002年
3 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
4 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
5 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
6 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前8条
1 杨文慧;企业内部知识共享研究[D];重庆大学;2003年
2 杨静;基于粗糙集合和信息熵的分类模型研究[D];合肥工业大学;2004年
3 杨瑞峰;WEB上基于文本挖掘的个性化检索系统的设计与实现[D];电子科技大学;2003年
4 龚银玲;重庆大学专业课过渡式双语教学研究[D];重庆大学;2004年
5 苏金燕;专题数据库系统平台的相关技术研究与实现[D];中国人民解放军军事医学科学院;2005年
6 张美香;贝叶斯文本分类器的研究与改进[D];太原理工大学;2005年
7 陈志敏;基于主题划分的Web文档自动摘要研究[D];扬州大学;2006年
8 庞剑锋;基于向量空间模型的自反馈的文本分类系统的研究与实现[D];中国科学院研究生院(计算技术研究所);2001年
【二级引证文献】
中国期刊全文数据库 前10条
1 夏欣;;面向个性化信息服务的模糊贝叶斯方法研究[J];安徽农业科学;2008年35期
2 陶小红;;Web数据挖掘在智能选课系统中的应用研究[J];办公自动化;2010年02期
3 黄丹宇;;混合型智能故障诊断方法在变压器运行中应用[J];变压器;2010年06期
4 满鹏;;海量文档信息的高效检索算法[J];长春大学学报;2008年02期
5 王俊伟;吴纬;;基于支持向量机的装备维修保障专业优化[J];四川兵工学报;2010年09期
6 刘辉;邵良杉;;Web文本分类中特征项权重的研究[J];科技和产业;2010年02期
7 陈子昕;;基于SVM的文本分类系统设计与实现[J];东莞理工学院学报;2008年03期
8 孙铁利;张妍;李晓微;;文本挖掘中特征降维方法比较研究[J];电脑知识与技术;2008年02期
9 张拥军;刘锦伟;;网络信息挖掘在电子商务系统中的应用[J];电脑知识与技术;2008年22期
10 周晗;赵卫东;季军;;一种用于文本分类的特征选择方法[J];电脑知识与技术;2008年34期
中国重要会议论文全文数据库 前9条
1 刘子豪;庄毅;;一种电子邮件敏感信息检测算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
2 马辉民;李卫华;;Web文档聚类系统的实现方法探析[A];第10届计算机模拟与信息技术会议论文集[C];2005年
3 李卫东;杨炳儒;李龙星;曲文龙;;基于中心词位置的VSM文本分类算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
4 白硕;程学旗;郭莉;王斌;余智华;刘群;;大规模内容计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 刘萍;谭建龙;;XML内容筛选中的快速串匹配算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 倪茂树;林鸿飞;;基于词共现概念的文本分类研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
7 李月伦;李湘;常宝宝;袁毓林;;一种基于认知情景框架的文本分类方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 代劲;何中市;胡峰;;一种高性能的文本特征自动提取算法[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
9 ;Feature Selection for Text Classification using OR+SVM-RFE[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国博士学位论文全文数据库 前10条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 杨帮华;自发脑电脑机接口技术及脑电信号识别方法研究[D];上海交通大学;2007年
4 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
5 李奇越;网络内容分析中基于硬件的字符串匹配算法的研究[D];中国科学技术大学;2008年
6 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
7 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
8 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
9 李云照;高速网数据过滤若干关键技术研究[D];国防科学技术大学;2009年
10 窦伊男;根据多维特征的网络用户分类研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
2 白冰;基于数据处理中心的企业竞争情报系统研究[D];山东科技大学;2010年
3 景三东;Web对象可缓存性与一致性问题研究[D];郑州大学;2010年
4 司贺华;网络内容审计系统关键技术研究与实现[D];哈尔滨工程大学;2010年
5 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年
6 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年
7 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
8 杨芹;基于最大熵模型的中文网页分类器设计和实现[D];苏州大学;2010年
9 芮文艳;基于数据挖掘的智能化辅助教学系统的研究与实现[D];苏州大学;2010年
10 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
【二级参考文献】
中国期刊全文数据库 前4条
1 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
2 鲁松,李晓黎,白硕,王实;文档中词语权重计算方法的改进[J];中文信息学报;2000年06期
3 刘开瑛,薛翠芳,郑家恒,周晓强;中文文本中抽取特征信息的区域与技术[J];中文信息学报;1998年02期
4 张晓辉,邵华,常桂然;WWW上的信息发现与搜索引擎技术[J];小型微型计算机系统;1998年06期
【相似文献】
中国期刊全文数据库 前10条
1 徐长通;李志勇;;以活动为中心的协作模型与平台研究[J];微计算机信息;2011年02期
2 苏变萍;侯筱婷;;文本数据的非线性降维方法研究[J];微电子学与计算机;2007年10期
3 冯锋;基于XML的多媒体课件模型的研究与设计[J];计算机与现代化;2004年06期
4 李君波,欧阳星明;一种基于XML的报表生成、管理模型[J];计算机应用研究;2001年12期
5 马忠宝;刘冠蓉;;基于支持向量机的中文文本分类模型研究[J];计算机技术与发展;2006年11期
6 章荣海;;基于Petri网的超文本模型及其深入研究[J];安徽大学学报(自然科学版);1997年03期
7 郝振明,贾洞;面向对象分析建模方法的研究[J];微机发展;1999年03期
8 梁卫星;;基于XML的分布式数据处理在电子商务中的应用[J];忻州师范学院学报;2010年05期
9 郭江平,张辉;基于数据库管理和存储的超文档模型[J];计算机应用;2000年08期
10 杨建林;;Mizzaro相关性模型的改进[J];情报学报;2006年01期
中国重要会议论文全文数据库 前10条
1 杨艳;李巍;玄萍;;数字图书馆中基于Ontology的文本模型[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
2 王强;黄楠;;混合像元分解研究综述[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
3 胡蓉蓉;高晓东;姚晶晶;蒋友进;;基于AMEsim和Simulink仿真平台对空气弹簧隔振效果的研究[A];四川省第九届(2009年)汽车学术交流年会论文集[C];2009年
4 李超;潘建明;张相年;蒋琳兰;;阿司匹林建立大鼠胚胎畸形模型的研究[A];2009年中国药学大会暨第九届中国药师周论文集[C];2009年
5 朱诗兵;;模糊优选评估系统[A];1995中国控制与决策学术年会论文集[C];1995年
6 周立佳;;船基方式气象导航模拟训练系统[A];中国航海学会海洋船舶驾驶专业委员会天气与航海安全论文集[C];1997年
7 刘汉奎;吕寿坤;徐殿国;;应用于电子镇流器的高强度气体放电灯建模方法综述[A];第12届全国电气自动化与电控系统学术年会论文集[C];2004年
8 付兴方;李宗植;;可修复性航材修理间隔期的确定策略[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
9 马为民;胡维银;;论建立土壤侵蚀模型在水保方案编制中的作用[A];水土保持依法行政的理论与方法——中国水土保持学会预防监督专业委员会第六次会议暨学术研讨会论文集[C];2006年
10 王正中;;仿真学科的研究与思考[A];2007系统仿真技术及其应用学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 记者 邵长春 特约记者 李玉峰 通讯员 青云;全国青少年航海模型总决赛在陵水举行[N];海南日报;2009年
2 潍坊中学 颜美平 毛韦清;巧思创新意,废物变模型[N];学知报;2011年
3 本报记者 傅莲英;第21届广州国际玩具及模型展集结鸣号[N];国际商报;2009年
4 范晓光 浙江省社会科学院社会学研究所;威斯康辛学派挑战“布劳-邓肯”的地位获得模型[N];中国社会科学报;2011年
5 本报记者 杨博;美证交会将审查标普评级模型[N];中国证券报;2011年
6 姜业庆;模型是关键:中国“宽客”启示录[N];中国经济时报;2011年
7 商务部国际贸易经济合作研究院欧洲所博士 朱一平;欧债危机有限解决方案长效机制初具模型[N];国际商报;2011年
8 CUBN 记者 孙先锋;用3i模型打动消费者[N];中国联合商报;2011年
9 宏飞 编译;Eqecat将公布三款调整后的灾难模型[N];中国保险报;2011年
10 记者 刘鹏;江西亿元打造“模型鄱阳湖”[N];人民长江报;2010年
中国博士学位论文全文数据库 前10条
1 贾长青;椎间盘退变,营养途径,形态及细胞凋亡的实验性研究[D];中国医科大学;2003年
2 李贵孚;基于特征价格理论的我国有线数字电视产品价格模型研究[D];吉林大学;2007年
3 袁宝招;水资源需求驱动因素及其调控研究[D];河海大学;2006年
4 赵世刚;中国商业银行企业文化测度研究[D];大连理工大学;2007年
5 廖亚立;生命价值的动态评估方法与实证研究[D];中国地质大学(北京);2008年
6 余明杨;变压器隔离全桥开关变换器的建模与应用技术研究[D];中南大学;2008年
7 赵海翔;风电引起的电压波动和闪变研究[D];中国电力科学研究院;2005年
8 王伯珉;预构皮瓣治疗四肢严重损伤的动物模型与实验研究[D];山东大学;2004年
9 刘燕;超临界流体制备超微颗粒的过程模拟与喷嘴设计[D];山东大学;2005年
10 关宏信;沥青混合料粘弹性疲劳损伤模型研究[D];中南大学;2005年
中国硕士学位论文全文数据库 前10条
1 李方圆;基于决策树的邮件分类技术研究[D];湖南师范大学;2007年
2 朱军;大鼠胰腺移植模型的建立及趋化因子在移植排斥反应中作用的实验研究[D];南京医科大学;2005年
3 王素娟;公司金融——股利政策理论研究[D];西安电子科技大学;2005年
4 李富雄;基于INTERNET的统一支付平台[D];广东工业大学;2005年
5 黄涛;面向应用级QoS中间件平台的解决方案[D];广东工业大学;2005年
6 李亚军;拓扑指数在环境与制药领域模型化应用的研究[D];北京化工大学;2005年
7 郝晓玲;陕西地方人才资源与经济发展关系及对策研究[D];西安科技大学;2005年
8 毕建欣;数据挖掘技术在我国保险业中的应用研究[D];福州大学;2005年
9 柳红;基于J2EE和工作流技术的校园OA系统建模分析及研究[D];中国海洋大学;2005年
10 朱宁;多级IP管理模型的研究与实现[D];江苏大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026