收藏本站
《信息安全与技术》 2011年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于自然语言处理的多级网页过滤器研究

康海燕  任俊玲  陈昕  王鹤沩  
【摘要】:针对现有网页过滤系统的不足和实时网络信息过滤的新挑战,提出新一代多级网页智能过滤解决方案:主要采用Mimefilte r技术,结合多级过滤方法对网页进行过滤。利用分类算法对已知的训练样本进行学习,提取特征向量,构造二值分类器。然后运用此分类器,对新的网页进行过滤,将过滤的结果提交给用户,用户可对过滤结果进行评价反馈,系统再根据反馈对过滤器进行调整。基于上述方法和理论,在Java EE 6+MySQL5.1平台上设计并开发了一个多级网页过滤系统。它能在提高信息安全度和不降低信息共享度之间找到一个平衡点。实验证明了多级过滤相结合的网页过滤器是可行的、高效的。

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 康海燕;陈然;苑晓姣;李清华;;基于Android防火墙日志系统的研究与实现[J];北京信息科技大学学报(自然科学版);2012年04期
【参考文献】
中国期刊全文数据库 前7条
1 康海燕;李飞娟;苏文杰;;基于问句表征的web智能问答系统[J];北京信息科技大学学报(自然科学版);2011年01期
2 龙夏;凌军;汤彪;方麟;;基于ISAPI过滤器的网页防篡改系统[J];合肥学院学报(自然科学版);2010年03期
3 梁党卫;彭文滔;边利亚;;垂直搜索引擎中过滤器的设计与实现[J];计算机应用与软件;2009年12期
4 沈凤仙;朱巧明;刘粉香;;改进的Web文本自适应过滤策略[J];计算机与现代化;2010年09期
5 黄萱菁,夏迎炬,吴立德;基于向量空间模型的文本过滤系统[J];软件学报;2003年03期
6 唐坚刚;魏然;;基于权重均值的不良网页过滤算法研究[J];计算机工程与设计;2008年05期
7 珠杰;罗潘;;基于HTML Parser的网页信息提取技术研究[J];西藏大学学报(自然科学版);2010年01期
【共引文献】
中国期刊全文数据库 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 明均仁;张帆;;网络文本信息过滤的意义及其模型初探[J];图书与情报;2007年04期
3 何海江;凌云;;由向量空间相关模型识别博客文章的垃圾评论[J];长沙大学学报;2008年02期
4 沈竞;蒋侨;;DSTFA分布式短文本过滤算法[J];四川兵工学报;2011年10期
5 张宁丹;;Rough Set在垃圾邮件过滤技术中的应用[J];湘南学院学报;2007年02期
6 许满英;张永奎;;基于突发事件新闻标题的文本过滤模型[J];电脑开发与应用;2010年04期
7 熊国萍;唐敏;;智能型文本过滤的创新模式与系统设计[J];电脑知识与技术;2010年12期
8 杨震;夏艳;陈晓勤;;适合话音服务平台的结构化小文本搜索引擎的研究[J];电信科学;2011年12期
9 谭玉玲;张新林;;一种基于主题分类的文本过滤方法及其硬件实现[J];湖南工程学院学报(自然科学版);2010年02期
10 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
中国重要会议论文全文数据库 前3条
1 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 朱振方;刘培玉;;求解中文文本信息过滤的自适应遗传算法及收敛性分析[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
2 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
3 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
4 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
5 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
6 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
7 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
8 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
9 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
10 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
中国硕士学位论文全文数据库 前10条
1 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
2 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
3 杨玉珍;基于统计与规则的特征权重计算方法研究与应用[D];山东师范大学;2011年
4 李欣;基于校园网的网络信息过滤系统的设计与实现[D];山东师范大学;2011年
5 曾芳;混合式教学支撑系统的设计与实现[D];西北大学;2011年
6 崔争艳;中文短文本分类的相关技术研究[D];河南大学;2011年
7 孙浩;基于主动学习的文本过滤系统的研究[D];北京邮电大学;2011年
8 匡哈雷;基于iBatis+AJAXRPC的“绿色E家”软件的设计与实现[D];华中师范大学;2011年
9 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
10 林伟锋;互联网内容安全审计系统的研究[D];华南理工大学;2011年
【同被引文献】
中国期刊全文数据库 前6条
1 王全民,王蕊,赵钦;Linux环境下的日志分析系统LASL[J];北京工业大学学报;2005年04期
2 吕学强;舒燕;施水才;;搜索日志中“V+N”、“V+V”型短语识别[J];北京信息科技大学学报(自然科学版);2012年02期
3 宋世杰,胡华平,胡笑蕾;关联规则和序列模式算法在入侵检测系统中的应用[J];成都信息工程学院学报;2004年01期
4 黄文;谢冬青;;基于Syslog的网络日志管理分析模型[J];湖南科技学院学报;2006年05期
5 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的搜索引擎用户行为分析[J];中文信息学报;2007年01期
6 杨建华;蒋玉明;彭轮;;数据挖掘在网络入侵检测中的应用研究[J];微计算机信息;2009年24期
【二级参考文献】
中国期刊全文数据库 前10条
1 黄鑫,尹宝林;多层次多策略的分布式网络信息过滤系统模型[J];北京航空航天大学学报;2003年10期
2 盖玲;;防网页篡改技术比较分析[J];图书与情报;2007年01期
3 杨红菊,梁吉业;布尔加权关联规则的几种开采算法及比较[J];电脑开发与应用;2004年04期
4 陆建江;加权关联规则挖掘算法的研究[J];计算机研究与发展;2002年10期
5 马亮,陈群秀,蔡莲红;一种改进的自适应文本信息过滤模型[J];计算机研究与发展;2005年01期
6 珠杰;欧珠;格桑多吉;;基于DOM修剪的藏文Web信息提取[J];计算机工程;2008年24期
7 马莉;唐素勤;陈立娜;蒋运承;;改进的基于句模匹配算法的问句理解方法[J];计算机工程;2009年20期
8 汤庸;林鹭贤;罗烨敏;潘炎;;基于自动问答系统的信息检索技术研究进展[J];计算机应用;2008年11期
9 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
10 郑实福,刘挺,秦兵,李生;自动问答综述[J];中文信息学报;2002年06期
中国硕士学位论文全文数据库 前2条
1 袁新成;基于向量空间模型的自适应文本过滤研究[D];哈尔滨工业大学;2006年
2 程书红;基于XML的Web信息抽取设计与实现[D];重庆大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 赵坤;;网页过滤中文本内容的抽取技术研究[J];硅谷;2010年08期
2 唐坚刚;熊国萍;;基于字频统计和数据挖掘技术的不良网页过滤模式的构建与应用[J];厦门大学学报(自然科学版);2007年S2期
3 唐坚刚;魏然;;基于权重均值的不良网页过滤算法研究[J];计算机工程与设计;2008年05期
4 吴瑞生;王加团;;基于知识的WEB信息采集系统研究[J];科技信息(学术研究);2008年30期
5 程基鹏;;一个网页过滤改进算法的应用与实现[J];电脑知识与技术;2009年33期
6 胡迪;陈运;杨义先;陈悦;;基于支持向量机与余弦夹角法的中文网页过滤的研究与设计[J];成都信息工程学院学报;2011年05期
7 韩利凯;马国俊;;基于SPI的个人网页过滤系统的研究与实现[J];航空计算技术;2006年05期
8 韩利凯;马国俊;;基于SPI的个人网页过滤系统的研究与实现[J];西安文理学院学报(自然科学版);2007年01期
9 唐坚刚;熊国萍;;基于语义的关键词过滤权重算法[J];微计算机信息;2007年27期
10 沈凤仙;朱巧明;;基于特征倾向性的网页特征提取方法研究[J];计算机工程与设计;2009年16期
中国硕士学位论文全文数据库 前10条
1 王强;面向专业主题的网页分类算法研究[D];国防科学技术大学;2005年
2 司德睿;基于文本内容的网页过滤技术研究[D];兰州大学;2008年
3 吕祥惠;领域本体在网页内容过滤中的应用研究[D];山东师范大学;2009年
4 刘辉;网页信息过滤系统的研究与设计[D];苏州大学;2009年
5 沈凤仙;一个WEB文本过滤系统设计与实现[D];苏州大学;2009年
6 高超;智能搜索中中文网页分类和聚类的初步研究[D];哈尔滨工程大学;2007年
7 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
8 伍丽芳;局域网安全行为监控系统的设计与实现[D];电子科技大学;2012年
9 樊清亮;嵌入式网页过滤装置设计[D];哈尔滨工程大学;2011年
10 杜洪伟;软件安全领域垂直搜索引擎的优化设计与实现[D];天津大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026