收藏本站
《河北大学学报(自然科学版)》 2003年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

文本挖掘研究进展

湛燕  陈昊  袁方  王丽娟  
【摘要】:数据挖掘是将人工智能技术和数据库技术紧密结合 ,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式 ,以满足人们不同应用的需要 .由于存储信息最多的自然形式就是文本 ,因此文本挖掘具有重要的意义 .结合笔者研究工作 ,主要介绍了文本挖掘的研究内容 ,挖掘过程 ,挖掘算法及应用前景 .

【引证文献】
中国期刊全文数据库 前5条
1 贝雨馨,崔荣一;文本分类中特征项权重的计算方法[J];延边大学学报(自然科学版);2004年03期
2 马金娜;田大钢;;基于支持向量机的中文文本自动分类研究[J];系统工程与电子技术;2007年03期
3 王一蕾,林世平;Web文本挖掘三种技术的比较[J];福建电脑;2003年12期
4 马金娜;田大钢;;基于SVM的中文文本自动分类研究[J];计算机与现代化;2006年08期
5 谭金波;;文本层次分类中特征项权重算法的比较研究[J];情报杂志;2007年09期
中国硕士学位论文全文数据库 前7条
1 余从津;非线性维数约减的研究及其应用[D];天津大学;2004年
2 贝雨馨;基于意义信息增益的文本特征项权重计算方法[D];延边大学;2004年
3 李丽珊;基于动态簇中心迁移的聚类算法及应用[D];福州大学;2005年
4 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
5 王建刚;基于Multi-Agent技术的知识共享系统研究[D];天津大学;2004年
6 王礼刚;基于XML的Web文本数据挖掘研究[D];西南大学;2007年
7 黄炜;关于商业数据处理的几点研究[D];上海交通大学;2007年
【参考文献】
中国期刊全文数据库 前3条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 林鸿飞,战学刚,姚天顺;基于概念的文本结构分析方法[J];计算机研究与发展;2000年03期
3 高新波,范九伦,谢维信;区间值数据模糊c-均值聚类新算法[J];西安电子科技大学学报;1999年05期
【共引文献】
中国期刊全文数据库 前10条
1 谢涛,蒋泽中;边坡系统稳定性多模型综合评价[J];四川建筑科学研究;2004年02期
2 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
3 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
4 唐志丹;房丽娜;;基于神经网络的本科教学工作评估的专家评价[J];鞍山科技大学学报;2006年05期
5 张永兴,胡居义,文海家;滑坡预测预报研究现状述评[J];地下空间;2003年02期
6 尚松浩,毛晓敏;基于BP神经网络的土壤冻结温度及未冻水含量预测模型[J];冰川冻土;2001年04期
7 张彦军,刘俊,张文栋;目标识别中的人工神经网络应用[J];微纳电子技术;2003年Z1期
8 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
9 侯福均,吴祈宗;基于遗传算法和模拟退火算法优化神经网络的铁路营业里程预测[J];北京理工大学学报;2004年03期
10 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
中国重要会议论文全文数据库 前10条
1 朱艳辉;王平;周咏梅;;一种基于Agent的中文Web信息自动检索系统(英文)[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
2 Chenggen Shi and Jie Lu Faculty of Information Technology, University of Technology, Sydney Po Box 123, Broadway, NSW 2007, Australia;An Information Retrieval Model by Using Weighting Technology[A];Proceedings of the Second International Conference on Information and Management Sciences[C];2003年
3 申培鲁;高安春;李秉雯;;MM5中尺度预报模式利用不同初始场模拟黄淮气旋结果的集成[A];山东气象学会2005年学术交流会优秀论文集[C];2005年
4 吴月明;王益群;李莉;;基于神经网络集成的可靠性分布模型的智能识别[A];2006年全国机械可靠性学术交流会论文集[C];2006年
5 王丹;蔡红柳;王斌;;基于混沌序列的数字水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
6 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 陈庆轩;郑德权;赵铁军;;多分类器融合的文本分类技术研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
8 Nuanwan Soonthornphisaj;Kanokwan Chaikulseriwat;Piyanan Tang-On;;Anti-Spam Filtering: A Centroid-Based Classification Approach[A];2002 6~(th) International Conference on Signal Processing Proceedings[C];2002年
9 SHI Hong-Bo;WANG Zhi-Hai;HUANG Hou-Kuan;Jing Li-Ping School of Computer and Information Technology, Northem Jiaotong University, Beiing, 100044;Text Classification Based on the TAN Model[A];2002 IEEE Region 10 Conference on Computers, Communications, Control and Power Engineering Proceedings[C];2002年
10 Huang Ke;Ma Shaoping State Key Lab of Intelligent Technology and Systems, Department of Computer Science and Technology, Tsinghua University, 100084, Beijing, China;Text Categorization Based On Concept Indexing and Principal Component Analysis[A];2002 IEEE Region 10 Conference on Computers, Communications, Control and Power Engineering Proceedings[C];2002年
中国博士学位论文全文数据库 前10条
1 宋朝辉;神经网络在空间光学窗口热光学性能研究中的应用[D];中国科学院长春光学精密机械与物理研究所;2000年
2 彭真明;地震反演中的非线性优化方法及应用研究[D];成都理工学院;2001年
3 崔建军;复杂构造成像方法研究[D];中南大学;2001年
4 曹龙汉;柴油机智能化故障诊断技术研究[D];重庆大学;2001年
5 胡伍生;GPS精密高程测量理论与方法及其应用研究[D];河海大学;2001年
6 陈昌富;仿生算法及其在边坡和基坑工程中的应用[D];湖南大学;2001年
7 郭大蕾;车辆悬架振动的神经网络半主动控制[D];南京航空航天大学;2002年
8 吴振锋;基于磨粒分析和信息融合的发动机磨损故障诊断技术研究[D];南京航空航天大学;2002年
9 向小东;基于神经网络与混沌理论的非线性时间序列预测研究[D];西南交通大学;2002年
10 简(王争)峰;基于XML的异构产品信息网上交换、检索技术研究与应用[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 潘伟;计算机视觉在农产品自动检测与分级中的研究——番茄的自动检测与分级[D];东北农业大学;2000年
2 黄素珍;并行多元搜索引擎的研究与设计[D];广西大学;2001年
3 杜民;应用神经网络的Internet智能代理的实现[D];暨南大学;2001年
4 漆随平;在线红外酸值(度)分析仪的研制与应用[D];甘肃工业大学;2001年
5 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
6 朱燕;基于人工智能与数据挖掘理论的企业决策支持系统[D];广东工业大学;2001年
7 杨良;电厂计划统计信息的分析与处理[D];华北电力大学;2001年
8 赵德双;知识人工神经网络在电磁工程中的应用[D];电子科技大学;2001年
9 唐胜;基于神经网络的农作物病害诊断专家系统的设计[D];湘潭大学;2001年
10 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
【同被引文献】
中国期刊全文数据库 前10条
1 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
2 李翠霞,于剑;一种模糊聚类算法归类的研究[J];北京交通大学学报;2005年02期
3 范亚芹,刘颖,李兴男;Web数据挖掘原理及实现[J];吉林大学学报(信息科学版);2003年04期
4 王顺久,张欣莉,丁晶,侯玉;投影寻踪聚类模型及其应用[J];长江科学院院报;2002年06期
5 朱靖波,姚天顺;文本内容主题的识别方法[J];东北大学学报(自然科学版);2002年05期
6 张晓辉,李莹,王华勇,赵宏;应用特征聚合进行中文文本分类的改进KNN算法[J];东北大学学报(自然科学版);2003年03期
7 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
8 林鸿飞,马雅彬;基于聚类的文本过滤模型[J];大连理工大学学报;2002年02期
9 谷波,张永奎;文本聚类算法的分析与比较[J];电脑开发与应用;2003年11期
10 吴佑寿,丁晓青;树分类器性能分析[J];电子学报;1991年04期
中国博士学位论文全文数据库 前8条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
3 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
6 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
7 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
8 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 李凡;数据挖掘技术的研究与应用[D];西安电子科技大学;2002年
2 杨凌;聚类分析中聚类数的确定问题[D];武汉科技大学;2001年
3 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年
4 杨文慧;企业内部知识共享研究[D];重庆大学;2003年
5 谢振亮;基于WEB挖掘技术的网页自动分类和聚类的研究[D];天津大学;2004年
6 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
7 黄隽毅;关于Web数据挖掘中HITS算法的研究[D];大连理工大学;2004年
8 梅胜;基于SVM的多层次大类别数文本分类系统(HJ-TCM)的设计与实现[D];南京理工大学;2004年
9 李健;聚类分析及其在文本挖掘中的应用[D];西安电子科技大学;2005年
10 卢娇丽;基于粗糙集的文本分类方法研究[D];山西大学;2005年
【二级引证文献】
中国期刊全文数据库 前3条
1 王一蕾,林世平;基于Web页面链接结构的挖掘算法[J];福州大学学报(自然科学版);2004年04期
2 谢科;张辉;陈鹏;庞斌;;文本分类系统关键技术[J];广西师范大学学报(自然科学版);2007年02期
3 谭金波;;文本层次分类中特征项权重算法的比较研究[J];情报杂志;2007年09期
中国博士学位论文全文数据库 前1条
1 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
2 柯慧燕;Web文本分类研究及应用[D];武汉理工大学;2006年
3 杨丽华;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2006年
4 宁静;基于数据挖掘的中文垃圾邮件过滤技术研究[D];西南交通大学;2006年
5 付渊;运用神经网络聚类方法推进构建本体的自动化[D];太原理工大学;2006年
6 李东林;中文信息过滤技术的研究与应用[D];辽宁科技大学;2006年
7 刘毅;基于粗糙集的文本分类技术研究[D];西南交通大学;2007年
8 王礼刚;基于XML的Web文本数据挖掘研究[D];西南大学;2007年
9 刘佳;Isomap算法及其在脑电产生源分类中的应用[D];河北工业大学;2006年
10 王雪飞;词间相关性对文本分类的影响[D];南京理工大学;2007年
【二级参考文献】
中国重要会议论文全文数据库 前1条
1 范九伦;裴继红;谢维信;;区间值模糊c-均值聚类算法[A];模糊集理论与应用——98年中国模糊数学与模糊系统委员会第九届年会论文选集[C];1998年
中国博士学位论文全文数据库 前1条
1 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
【相似文献】
中国期刊全文数据库 前10条
1 王珍珍;;关于文本挖掘中文本分类与文本聚类的研究[J];科技信息;2007年06期
2 崔志明,谢春丽;基于Web的文本挖掘研究[J];微电子学与计算机;2002年10期
3 张骏;郭慧;;基于文件指纹的Web文本挖掘[J];计算机与信息技术;2009年05期
4 章成志;;文本聚类结果描述研究综述[J];现代图书情报技术;2009年02期
5 胡冰;胡东军;马文超;;文本挖掘研究及发展[J];电脑知识与技术;2008年31期
6 杨霞;黄陈英;;文本挖掘综述[J];科技信息;2009年33期
7 黄迎春;李晓晔;邓文新;;文本挖掘技术的研究[J];齐齐哈尔大学学报;2006年03期
8 郭玉滨;;Web文本挖掘技术及其应用的研究[J];电脑知识与技术(学术交流);2006年08期
9 吴岳芬;刘洪辉;;WEB文本挖掘的研究[J];电脑知识与技术(学术交流);2006年11期
10 谢冬;刘宏申;;文本挖掘中若干关键问题的研究[J];电脑知识与技术;2009年18期
中国重要会议论文全文数据库 前10条
1 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
2 张猛;王大玲;于戈;;一种基于自动阈值发现的文本聚类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
4 丁堃;许侃;;基于文本聚类方法的我国科技管理研究领域的计量研究[A];第三届科技政策与管理学术研讨会暨第二届科教发展战略论坛论文汇编[C];2007年
5 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
7 王莹;刘杨;;维基百科的文本聚类方法分析[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
8 陈林;王晓华;李殿赟;文俊浩;;基于Web的自增模式文本挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
9 陈林;王晓华;李殿赟;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
10 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
中国重要报纸全文数据库 前10条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
4 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
5 汪洋 编译;BI平民化[N];计算机世界;2004年
6 靳辉;垂直搜索:呼叫经济发展的核心动力[N];通信产业报;2007年
7 缪其浩记者 江世亮;非官方信息源担当应急预警器[N];文汇报;2008年
8 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
9 本报记者 张承东;挖潜无极限[N];网络世界;2006年
10 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
2 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
5 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
6 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
7 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
8 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
9 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
10 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
中国硕士学位论文全文数据库 前10条
1 芦立华;基于后缀树的中文文本聚类算法研究[D];上海海事大学;2005年
2 谭颖;文本挖掘中的聚类算法研究[D];吉林大学;2009年
3 蔡坤;基于特征词的文本聚类算法研究[D];河南大学;2009年
4 李伯阳;文本聚类方法研究及其应用[D];厦门大学;2008年
5 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
6 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
7 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
8 于丽丽;基于DK-Means算法的文本聚类的研究与实现[D];东北大学;2008年
9 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
10 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026