收藏本站
《微计算机信息》 2007年27期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于语义的关键词过滤权重算法

唐坚刚  熊国萍  
【摘要】:在关键词权重统计算法的基础上,从语义角度出发,通过关键词对主题的表征强度并考虑关键词在文档中的位置等其他因素来计算关键词权重,为此创造性地提出了基于语义的矩阵词典和权重策略,使过滤更高效且权重取值更合理。实验表明,其对不良网页的过滤准确率也更高。

手机知网App
【引证文献】
中国重要会议论文全文数据库 前1条
1 廖光忠;黄泽鑫;;基于HowNet语义算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
【参考文献】
中国期刊全文数据库 前2条
1 孙阳波;张明清;;基于Web的信息系统安全风险评估工具的设计[J];微计算机信息;2006年21期
2 黄萱菁,夏迎炬,吴立德;基于向量空间模型的文本过滤系统[J];软件学报;2003年03期
【共引文献】
中国期刊全文数据库 前10条
1 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
2 贺卫红;曹毅;;基于向量空间模型文本过滤算法[J];系统工程;2005年10期
3 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期
4 伊文敏,高岩,王颖;评估信息过滤系统的方法及衡量标准概述[J];河北建筑工程学院学报;2004年02期
5 丁月华,文贵华,郭炜强;基于核向量空间模型的专利分类[J];华南理工大学学报(自然科学版);2005年08期
6 王映,常毅,谭建龙,白硕;基于N元汉字串模型的文本表示和实时分类的研究与实现[J];计算机工程与应用;2005年05期
7 赵丰年;刘林;商建云;;基于概念的文本过滤模型[J];计算机工程与应用;2006年04期
8 张帆;杨炳儒;;基于文本过滤的数字图书馆个性化服务技术[J];计算机工程与应用;2006年31期
9 冯是聪,张志刚,李晓明;一种中文网页自动分类方法的实现及应用[J];计算机工程;2004年05期
10 郭炜强;戴天;文贵华;;基于领域知识的专利自动分类[J];计算机工程;2005年23期
中国重要会议论文全文数据库 前2条
1 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
3 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
4 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
5 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
6 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年
7 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
8 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
9 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
10 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年
中国硕士学位论文全文数据库 前10条
1 田萱;基于Internet的信息检索若干问题的研究[D];山东师范大学;2003年
2 方兰;基于局域网的信息推送系统[D];江西师范大学;2004年
3 谭利文;基于用户模型的个性化网络文献检索系统的研究与设计[D];吉林大学;2004年
4 孙岩国;基于Internet的中文文本过滤系统的研究与实践[D];兰州理工大学;2004年
5 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年
6 张敏;基于Web挖掘的个性化信息检索研究[D];山东科技大学;2004年
7 迟学芝;基于自学习机制的信息过滤模型研究与实践[D];山东师范大学;2005年
8 马志柔;中文信息检索分类技术的研究[D];北京化工大学;2005年
9 曾义聪;基于概念树的主题爬取技术研究[D];湖南大学;2005年
10 马彦波;基于本体论的信息过滤技术研究[D];西北大学;2005年
【同被引文献】
中国期刊全文数据库 前5条
1 王枞,钟义信;网络信息内容安全[J];计算机工程与应用;2003年30期
2 万国根;秦志光;;面向信息内容安全的文本过滤和分类系统研究与实现[J];计算机科学;2005年07期
3 雷景生,林冬雪,符浅浅;基于改进向量空间模型的Web信息检索技术研究[J];计算机工程;2005年01期
4 周威成,马素霞;非法网页过滤的研究与实现[J];计算机应用;2003年10期
5 薛梅,熊江,杨德仁,顾海,顾君忠;分布式系统中信息内容安全的通用模型研究[J];计算机应用研究;2005年05期
【二级参考文献】
中国期刊全文数据库 前2条
1 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
2 杨赞国 ,高敬惠;基于C/S模式的网络信息管理系统设计与实现[J];微计算机信息;2005年11期
【相似文献】
中国期刊全文数据库 前10条
1 康耀红;情报检索的向量空间模型[J];情报理论与实践;1989年03期
2 刘宁,陈光祚,路学;论全文检索系统[J];现代图书情报技术;1989年04期
3 韦秀先;李正吾;;情报检索向量空间模型的几点补充[J];技术与市场;1993年02期
4 杜林;搜索引擎如何在幕后工作[J];中国计算机用户;1997年34期
5 王娟琴;三种检索模型的比较分析研究——布尔、概率、向量空间模型[J];情报科学;1998年03期
6 冯项云;LSI潜在语义标引方法在情报检索中的应用[J];现代图书情报技术;1998年04期
7 牛金芳;网上搜寻——一种新的资料搜集方法[J];河南图书馆学刊;1998年04期
8 齐向华;文本信息检索模型[J];晋图学刊;1998年03期
9 蒋晓冬,金宇晖,强庆华;基于改进VSM的大规模真实文档自动分类系统的研究和实现[J];现代计算机;1998年03期
10 林鸿飞,战学刚,姚天顺;文本层次分析与文本浏览[J];中文信息学报;1999年04期
中国重要会议论文全文数据库 前10条
1 万敏;罗振声;郭玉箐;;自动文摘系统中的意义段划分问题研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 王慧玲;宋柔;戴伟长;;汉语文本按语体分类的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 张刚;刘挺;秦兵;车万翔;李生;;面向信息内容安全的文本过滤系统研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 鲁松;白硕;;词距离的计算方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 卜东波;白硕;;文摘自动生成中权重计算的对偶性策略[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
9 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
10 苏贵洋;王永成;马颖华;;信息自动获取的结构模型[A];第一届学生计算语言学研讨会论文集[C];2002年
中国重要报纸全文数据库 前2条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
2 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
3 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
4 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
5 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
6 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
7 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
8 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
9 王修力;基于描述复杂性的信息检索理论与若干模型研究[D];北京语言大学;2006年
10 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
中国硕士学位论文全文数据库 前10条
1 杜民;应用神经网络的Internet智能代理的实现[D];暨南大学;2001年
2 蒋伟华;搜索引擎中的信息抽取技术研究[D];湖南大学;2001年
3 周斌;应用于数字图书馆的分布式检索技术的研究与实现[D];国防科学技术大学;2001年
4 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
5 马丽娜;基于Web的数据挖掘技术研究[D];山东师范大学;2002年
6 任美睿;数字图书馆中词频提取和自动文本分类方法的研究[D];黑龙江大学;2002年
7 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
8 田萱;基于Internet的信息检索若干问题的研究[D];山东师范大学;2003年
9 董建设;基于HTML标记分析及中文切词的网页索引研究与实现[D];兰州理工大学;2003年
10 孙登峰;XML文档信息检索技术研究与实现[D];中国人民解放军国防科学技术大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026