收藏本站
《湖南工程学院学报(自然科学版)》 2010年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于主题分类的文本过滤方法及其硬件实现

谭玉玲  张新林  
【摘要】:针对不良文本的过滤问题,提出一种基于主题分类的文本过滤方法,通过对文本信息进行向量化,引人文本特征抽取技术,筛选出针对文本内容的最优的特征项集合,利用SVM分类技术,来判断文本的态度和立场,达到内容审查过滤的目的.并利用DSP在硬件上加以实现,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率,且过滤时间大幅减少.
【作者单位】罗定职业技术学院电子信息工程系;
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 黄萱菁,夏迎炬,吴立德;基于向量空间模型的文本过滤系统[J];软件学报;2003年03期
【共引文献】
中国期刊全文数据库 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
3 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期
4 伊文敏,高岩,王颖;评估信息过滤系统的方法及衡量标准概述[J];河北建筑工程学院学报;2004年02期
5 丁月华,文贵华,郭炜强;基于核向量空间模型的专利分类[J];华南理工大学学报(自然科学版);2005年08期
6 王映,常毅,谭建龙,白硕;基于N元汉字串模型的文本表示和实时分类的研究与实现[J];计算机工程与应用;2005年05期
7 赵丰年;刘林;商建云;;基于概念的文本过滤模型[J];计算机工程与应用;2006年04期
8 张帆;杨炳儒;;基于文本过滤的数字图书馆个性化服务技术[J];计算机工程与应用;2006年31期
9 冯是聪,张志刚,李晓明;一种中文网页自动分类方法的实现及应用[J];计算机工程;2004年05期
10 郭炜强;戴天;文贵华;;基于领域知识的专利自动分类[J];计算机工程;2005年23期
中国重要会议论文全文数据库 前3条
1 马后锋;樊兴华;;一种改进的增量贝叶斯分类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
3 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
4 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
5 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
6 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年
7 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
8 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
9 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
10 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 田萱;基于Internet的信息检索若干问题的研究[D];山东师范大学;2003年
2 方兰;基于局域网的信息推送系统[D];江西师范大学;2004年
3 谭利文;基于用户模型的个性化网络文献检索系统的研究与设计[D];吉林大学;2004年
4 孙岩国;基于Internet的中文文本过滤系统的研究与实践[D];兰州理工大学;2004年
5 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
6 张敏;基于Web挖掘的个性化信息检索研究[D];山东科技大学;2004年
7 迟学芝;基于自学习机制的信息过滤模型研究与实践[D];山东师范大学;2005年
8 马志柔;中文信息检索分类技术的研究[D];北京化工大学;2005年
9 曾义聪;基于概念树的主题爬取技术研究[D];湖南大学;2005年
10 马彦波;基于本体论的信息过滤技术研究[D];西北大学;2005年
【二级参考文献】
中国期刊全文数据库 前1条
1 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
【相似文献】
中国期刊全文数据库 前10条
1 王月;柴瑞敏;;减聚类的模糊C-均值算法在文本分类中的应用[J];计算机系统应用;2010年03期
2 杜一平;刘燕君;;基于优势率的改进二元特征提取方法[J];计算机系统应用;2010年02期
3 盛宇;刘俊熙;龙怡;郭金兰;;用VB.NET实现基于案例的知识管理系统[J];现代情报;2010年01期
4 宋东光;张辉松;黄林旋;刘尊良;;Unix下EST数据库本地化更新及序列预处理分析[J];生物信息学;2010年01期
5 洪智勇;秦克云;邓维斌;;基于VPRS理论的一种混合分类算法[J];计算机工程与应用;2010年09期
6 吕曹芳;朱岳超;;数据挖掘技术在军事情报挖掘中的应用[J];黑龙江科技信息;2010年02期
7 焦庆争;蔚承建;;一种可靠信任推荐文本分类特征权重算法[J];计算机应用研究;2010年02期
8 何俊杰;陆军;;改进WEB数据挖掘方法及其在个性化推荐中的应用[J];科技管理研究;2010年06期
9 朱颢东;钟勇;;基于NDF和优化的ID3的特征选择方法[J];暨南大学学报(自然科学与医学版);2010年01期
10 刘金岭;;基于主题的中文短信文本分类研究[J];计算机工程;2010年04期
中国重要会议论文全文数据库 前10条
1 林令娟;刘希玉;;基于微粒群优化的快速K-近邻分类算法[A];第三届中国智能计算大会论文集[C];2009年
2 赵纪元;罗霄;;面向中图法的学术文献自动分类研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 苏小康;何婷婷;涂新辉;何金卓;;一种基于维基百科知识库的中文文本分类方法研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
5 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
6 江涛;于洪志;徐涛;;互联网藏文内容安全检测过滤系统研究[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
7 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
8 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
9 陈沧;沈洁;高莺;刘春阳;叶君峰;;基于类别层次体系的商品分类研究[A];第五届全国信息检索学术会议论文集[C];2009年
10 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前6条
1 记者 徐建华;网络扫黄 标准帮忙[N];中国质量报;2010年
2 记者 徐建华;“绿色上网”新标准为手机扫黄[N];中国质量报;2010年
3 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
4 希安;微软试水信息检索[N];经济日报;2004年
5 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
6 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
2 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
3 胡明涵;面向领域的文本分类与挖掘关键技术研究[D];东北大学 ;2009年
4 赵玉茗;文本间语义相关性计算及其应用研究[D];哈尔滨工业大学;2009年
5 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
6 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
7 郝立柱;汉语文本自动分类[D];吉林大学;2008年
8 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
9 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
10 封毅;中医药知识发现可靠性研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 梅君;中文文本分类的研究与应用[D];南昌大学;2010年
2 刘依璐;基于机器学习的中文文本分类方法研究[D];西安电子科技大学;2009年
3 刘彧;基于贝叶斯理论的文本分类技术的研究与实现[D];吉林大学;2009年
4 张琳;基于本体的文本分类的研究与实现[D];沈阳工业大学;2009年
5 李福帮;基于大规模人工神经网络的可扩展文本分类算法研究[D];北京工业大学;2009年
6 吴韦;文本分类语料库自动创建系统的研究与实现[D];武汉理工大学;2009年
7 谭龙远;基于领域的网络爬虫技术的研究与实现[D];武汉理工大学;2009年
8 周倩;基于RS-SVM的中文文本分类研究[D];天津财经大学;2009年
9 荣光;中文文本分类方法研究[D];山东师范大学;2009年
10 王丽红;基于粗糙集理论的文本分类技术研究[D];天津师范大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026