收藏本站
《厦门大学学报(自然科学版)》 2007年S2期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于字频统计和数据挖掘技术的不良网页过滤模式的构建与应用

唐坚刚  熊国萍  
【摘要】:为快速有效地过滤不良网页以保障校园网信息安全,创造性地提出了一个基于字频统计和数据挖掘技术的不良网页过滤模式,通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤.实验表明,该模式能以较快的速度和较高的准确率过滤测试文档集中的不良网页.

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 冯鸥鹏;垃圾短信过滤中字特征与词特征对过滤效果的比较研究[D];北京邮电大学;2011年
2 周鑫;GPRS网络优化中小区流量的预测研究[D];湖南大学;2010年
【参考文献】
中国期刊全文数据库 前2条
1 李强;李建华;;基于向量空间模型的过滤不良文本方法[J];计算机工程;2006年10期
2 黄萱菁,夏迎炬,吴立德;基于向量空间模型的文本过滤系统[J];软件学报;2003年03期
【共引文献】
中国期刊全文数据库 前10条
1 康海燕;任俊玲;陈昕;王鹤沩;;基于自然语言处理的多级网页过滤器研究[J];信息安全与技术;2011年10期
2 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
3 明均仁;张帆;;网络文本信息过滤的意义及其模型初探[J];图书与情报;2007年04期
4 何海江;凌云;;由向量空间相关模型识别博客文章的垃圾评论[J];长沙大学学报;2008年02期
5 沈竞;蒋侨;;DSTFA分布式短文本过滤算法[J];四川兵工学报;2011年10期
6 张宁丹;;Rough Set在垃圾邮件过滤技术中的应用[J];湘南学院学报;2007年02期
7 高峰;张永奎;;基于最大熵模型的不良文本识别[J];电脑开发与应用;2009年01期
8 许满英;张永奎;;基于突发事件新闻标题的文本过滤模型[J];电脑开发与应用;2010年04期
9 熊国萍;唐敏;;智能型文本过滤的创新模式与系统设计[J];电脑知识与技术;2010年12期
10 杨震;夏艳;陈晓勤;;适合话音服务平台的结构化小文本搜索引擎的研究[J];电信科学;2011年12期
中国重要会议论文全文数据库 前3条
1 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 朱振方;刘培玉;;求解中文文本信息过滤的自适应遗传算法及收敛性分析[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
2 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
3 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
4 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
5 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
6 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
7 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
8 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
9 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
10 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
中国硕士学位论文全文数据库 前10条
1 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
2 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
3 杨玉珍;基于统计与规则的特征权重计算方法研究与应用[D];山东师范大学;2011年
4 李欣;基于校园网的网络信息过滤系统的设计与实现[D];山东师范大学;2011年
5 李霞;文本过滤防火墙技术研究[D];北方工业大学;2011年
6 曾芳;混合式教学支撑系统的设计与实现[D];西北大学;2011年
7 崔争艳;中文短文本分类的相关技术研究[D];河南大学;2011年
8 孙浩;基于主动学习的文本过滤系统的研究[D];北京邮电大学;2011年
9 匡哈雷;基于iBatis+AJAXRPC的“绿色E家”软件的设计与实现[D];华中师范大学;2011年
10 林伟锋;互联网内容安全审计系统的研究[D];华南理工大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 周宏宇;张政;;中文分词技术综述[J];安阳师范学院学报;2010年02期
2 房振勇;游文虎;冯汝鹏;;改进BP算法在模糊神经网络中的应用[J];北京航空航天大学学报;2007年11期
3 陈军;盛占石;陈照章;孙俊;张兵;;基于GPRS的水质自动监测系统的设计[J];传感器与微系统;2009年07期
4 朱赵辉;郑东健;张晓华;;混沌-数据挖掘模型在大坝安全预测中的应用[J];长江科学院院报;2007年05期
5 程葆伦;谈AR(P)模型及其应用[J];重庆职业技术学院学报;2003年03期
6 李鹏;张玉艳;勾学荣;;基于GSM/GPRS/EDGE网络的业务量预测方法研究[J];电信工程技术与标准化;2008年05期
7 杨彬,郭大宁;我国移动通信的现状及发展趋势[J];东华大学学报(自然科学版);2001年06期
8 解梅;移动通信技术及发展[J];电子科技大学学报;2003年02期
9 陆安生,陈永强,屠浩文;决策树C5算法的分析与应用[J];电脑知识与技术;2005年09期
10 龙树全;赵正文;唐华;;中文分词算法概述[J];电脑知识与技术;2009年10期
中国硕士学位论文全文数据库 前4条
1 钟延辉;基于文本挖掘的垃圾短信过滤方法[D];电子科技大学;2009年
2 吴本昌;时间序列数据挖掘在气象领域的应用研究[D];兰州大学;2009年
3 张宇;决策树分类及剪枝算法研究[D];哈尔滨理工大学;2009年
4 王心芳;垃圾短信的识别与处理[D];贵州大学;2009年
【二级引证文献】
中国期刊全文数据库 前1条
1 朱秋君;王平;田贵云;闫小明;王海涛;;基于BP神经网络的巴克豪森铁轨温度应力检测[J];无损检测;2011年12期
中国硕士学位论文全文数据库 前1条
1 吴世竞;垃圾短信过滤系统的设计与实现[D];北京邮电大学;2012年
【二级参考文献】
中国期刊全文数据库 前2条
1 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
2 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
【相似文献】
中国期刊全文数据库 前10条
1 熊国萍;唐敏;;智能型文本过滤的创新模式与系统设计[J];电脑知识与技术;2010年12期
2 唐坚刚;熊国萍;;自适应不良网页过滤模式的研究与实践[J];计算机工程与设计;2008年20期
3 师军,曹菡,高晓娟;链式统频方法[J];现代电子技术;1996年02期
4 白中英,朱志英;中文资料的机器考证展望[J];信息与控制;1981年06期
5 李五文;Dong2病毒的动态跟踪与剖析[J];微电脑世界;1995年08期
6 姜贤塔,陈根才;利用字频统计及机器学习的自动文摘方法[J];浙江大学学报(理学版);1997年03期
7 柯昌献;一个小型查找程序[J];计算机应用研究;1991年06期
8 蔡晨曦,王秀坛,彭应宁;基于两维压缩特征字分析的BIST性能分析[J];系统工程与电子技术;2001年09期
9 张树波,赖剑煌;车牌定位和分割的一种综合方法[J];中山大学学报(自然科学版);2004年02期
10 才让卓玛;才智杰;;藏文字频统计系统中字构件分解算法[J];计算机工程与科学;2011年03期
中国重要会议论文全文数据库 前10条
1 谢延;孙知信;;网络游戏流量特征字发现技术[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
2 陈一凡;朱亮;;二十一世纪初汉语字、词流通频度统计[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
3 吴悠;黄华军;;一种基于字频的文本数字水印算法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 宋兰;孙茂松;;中文文本全文查重的实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 董兆杰;;字频统计与识字教育科学化——小学识字教学的字种、字量和字序研究[A];第二届全国教育教材语言专题学术研讨会论文集[C];2008年
6 董兆杰;;小学识字量表研制是识字教学改革的奠基工程[A];第二届全国教育教材语言专题学术研讨会论文集[C];2008年
7 “汉字应用水平测试研究”课题组 ;孙曼均;;汉字应用水平测试用字的统计与分级[A];语言文字应用研究论文集(Ⅱ)[C];2004年
8 陈磊;;IP网络流量的识别与管理[A];中国通信学会信息通信网络技术委员会2009年年会论文集(上册)[C];2009年
9 陈菲;;幼儿认字教学测验评估报告[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
10 马龙;;指纹识别的门禁系统[A];天津市电视技术研究会2009年年会论文集(1)[C];2009年
中国重要报纸全文数据库 前6条
1 本报记者 邹奕萍;计算机病毒防毒透视[N];通信信息报;2002年
2 山东 周少军;国产浏览器新秀ZTZ-IE[N];电脑报;2001年
3 林俊铭;漳州地名用字解析[N];闽南日报;2008年
4 江苏 CZZZ;木马克星的威力[N];电脑报;2003年
5 周泰宇;由“钱”变“泉”的深层含义[N];中国商报;2004年
6 刘洪斌;畅通无阻宽带路(4)[N];电脑报;2002年
中国博士学位论文全文数据库 前2条
1 朱国胜;高速分组查找规则匹配算法研究[D];华中科技大学;2010年
2 崎川隆;宾组甲骨文字体分类研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 王慧谦;基于端口号、统计特征和协议特征字的实时数据流分类[D];山东大学;2011年
2 韩晓川;《甲骨文合集补编》第四、五期文字基础整理与初步研究[D];苏州大学;2012年
3 王晓红;《甲骨文合集补编》第二、三期文字基础整理与研究[D];苏州大学;2012年
4 杜飞;基于特征字的病毒过滤防火墙技术研究[D];北方工业大学;2010年
5 程南昌;语料处理软件的设计与实现[D];广西民族大学;2008年
6 李思栋;《小屯南地甲骨》文字的基础整理与研究[D];苏州大学;2010年
7 赵玉艳;《甲骨文合集补编》第一期文字基础整理与初步研究[D];苏州大学;2012年
8 陈蕾;一种面向移动互联网的业务识别方法研究[D];吉林大学;2011年
9 王建军;殷墟卜辞字形特征及类型划分[D];郑州大学;2006年
10 杜鑫;基于DPI和DFI的P2P流量实时监测系统的开发[D];电子科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026