收藏本站
《计算机工程与应用》 2001年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于内容的网页特征提取

张义忠  赵明生  朱精南  
【摘要】:文章主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取。通过对旅游类网页的实验结果显示,文中的方法和应用效果良好。

【引证文献】
中国期刊全文数据库 前8条
1 马建华;;面向职业教育的主题蜘蛛的设计与实现[J];电脑知识与技术;2008年27期
2 何静媛;张程;;基于Agent的搜索引擎智能个性化设计[J];重庆大学学报(自然科学版);2005年12期
3 孔素然;;基于散列思想的网页去重系统[J];硅谷;2010年22期
4 徐辉银;;自动特征提取在P2P网络电视业务识别中的应用[J];广东通信技术;2008年06期
5 刚春燕;吴恩斯;;基于MAS兴趣模型的搜索引擎设计[J];计算机与信息技术;2009年04期
6 许建潮,侯锟;Web信息的自主抽取方法[J];计算机工程与应用;2005年14期
7 熊忠阳,胡月,曾令秋,张玉芳;一种基于Agent的数据挖掘结果模式推荐模型[J];计算机应用研究;2004年02期
8 梁延华,胡红霞,王振兴,李申堂;网上敏感信息智能快报系统的设计与实现[J];信息工程大学学报;2003年04期
中国博士学位论文全文数据库 前2条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 卢小康;中文文本复制检测技术研究[D];杭州电子科技大学;2009年
2 宋超;基于Sogou日志的个性化信息检索分析与建模[D];哈尔滨工业大学;2010年
3 张程;基于智能Agent的搜索引擎研究[D];重庆大学;2002年
4 曹渝昆;基于RDF的个性化服务模型[D];重庆大学;2002年
5 王胜明;智能推拉技术在物资管理系统中的应用[D];华北电力大学(河北);2003年
6 刘军;基于贝叶斯网络的智能检索模型[D];西南交通大学;2004年
7 刘七;基于Web文本内容的信息过滤系统的研究与设计[D];南京理工大学;2004年
8 林丽;数字图书馆数据挖掘研究[D];武汉大学;2004年
9 王玲;基于内容的WWW图像检索研究[D];山东师范大学;2004年
10 王术;面向个性化服务的网页特征描述方法研究[D];重庆大学;2004年
【参考文献】
中国期刊全文数据库 前3条
1 何新贵,彭甫阳;中文文本的关键词自动抽取和模糊分类[J];中文信息学报;1999年01期
2 刘开瑛,郑家恒,刘静;基于《金融档案分类表》的自动分类算法研究[J];情报学报;1997年05期
3 许建潮,胡明;文书类档案的分类标引研究[J];情报学报;1999年03期
【共引文献】
中国期刊全文数据库 前10条
1 文庭孝;情报检索中汉语语词自动切分研究[J];图书与情报;2001年02期
2 吴玉丰;《中国学术期刊(光盘版)》的检索方法[J];图书与情报;2003年01期
3 郭家义;网络信息检索效率研究[J];图书与情报;2003年02期
4 龚蛟腾;Internet信息资源及信息检索[J];图书与情报;2003年06期
5 王永丽;徐桂香;姜官凤;;Elsevier Science全文数据库使用指南[J];吉林大学学报(医学版);2007年05期
6 杨延锟;许少华;;基于FVSM的核聚类算法在文本聚类中的应用[J];长江大学学报(自然科学版)理工卷;2010年01期
7 郑俭;叶帮利;;特殊教育专家系统研究(图书馆会议稿)——一个图书馆人承担横向科研课题的实例[J];重庆图情通讯;2001年01期
8 邱宏,付琼;联机检索与网络信息检索的比较研究[J];东北电力学院学报;2001年02期
9 李龙澍,张霞;一种基于语义贴近度的模糊检索算法[J];东南大学学报;1998年05期
10 黄德玲;Internet网络检索与联机信息检索[J];电脑知识与技术;2004年14期
中国重要会议论文全文数据库 前7条
1 盛作国;胡红;;情报推理的逻辑理论工具——制约逻辑在情报科学中的应用[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
2 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
3 罗海飞;虞立群;章志凌;邵晓敏;陈林;汪更生;陈弈秋;何伟杰;;一种改进型CHI的特征抽取方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
4 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 张庆国;章成志;薛德军;张君玉;;基于K最近邻的隐含主题自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 魏国志;骆斌;商琳;;基于WWW方式的法律法规检索系统的设计与实现[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
7 卞真旭;;一种关键词抽取方法研究[A];2011年安徽省智能电网技术论坛论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
2 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
3 WANG Jiayue;[D];广东外语外贸大学;2003年
4 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
5 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
6 宋继平;面向机器翻译的双语信息处理系统的设计与实现[D];中国科学院研究生院(计算技术研究所);1999年
7 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
8 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
9 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
10 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
2 刘佳音;基于本体的个性化信息系统的应用研究[D];杭州电子科技大学;2009年
3 王春芹;搜索引擎主题相关性研究[D];中山大学;2010年
4 卫森生;基于Z39.50的因特网用户端信息检索系统设计与实现[D];大连理工大学;2000年
5 查贵庭;经济新闻自动标引系统的研究[D];南京农业大学;2000年
6 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
7 汪志南;农业信息自然语言控制系统的研究[D];中国农业科学院;2001年
8 薛鹏军;基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D];南京农业大学;2001年
9 王祥君;中医药信息智能检索系统的设计与实现[D];浙江大学;2002年
10 乔冬梅;搜索引擎现状与发展研究[D];郑州大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
3 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期
4 潘伯荣;中国人名音译初探[J];编辑学报;1991年04期
5 胡誉耀;元搜索引擎在数字图书馆中的运用[J];图书与情报;2003年05期
6 郝慧珍,傅汝林;基于IP伪装的网络安全技术研究[J];成都理工学院学报;2002年03期
7 陈德礼;;基于JXTA的层次性P2P搜索引擎框架的研究与设计[J];重庆工学院学报(自然科学版);2007年07期
8 赖祖龙;万幼川;申邵洪;徐景中;;基于Hilbert排列码与R树的海量LIDAR点云索引[J];测绘科学;2009年06期
9 曾韬;应用非结构化信息管理技术实现多层次知识管理需求[J];中国传媒科技;2004年06期
10 刘必雄,蔡建兵;当前分布式计算解决方案简介[J];重庆科技学院学报;2005年01期
中国重要会议论文全文数据库 前1条
1 罗亚平;王枞;周延泉;;基于关注度的热点话题发现模型[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 骆正虎;移动Agent系统若干关键技术问题研究[D];合肥工业大学;2002年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
4 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
5 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
6 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
7 鲁松;自然语言处理中词相关性知识无导获取和均衡分类器构建[D];中国科学院研究生院(计算技术研究所);2001年
8 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
9 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年
10 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 姚松源;文本自动分类系统的研究与实现[D];北京工业大学;2003年
2 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
3 袁莉;基于Web的个性化信息服务机制[D];四川大学;2001年
4 袁宏;基于移动Agent的中文信息搜索引擎系统模型的研究[D];沈阳工业大学;2003年
5 刘峰;通用中英文专业搜索引擎技术的研究及应用[D];大连理工大学;2004年
6 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
7 王亮;搜索引擎及其相关性排序研究[D];武汉大学;2004年
8 王术;面向个性化服务的网页特征描述方法研究[D];重庆大学;2004年
9 刘妮娜;Web数据挖掘和个性化搜索引擎研究[D];浙江大学;2005年
10 李健;聚类分析及其在文本挖掘中的应用[D];西安电子科技大学;2005年
【二级引证文献】
中国期刊全文数据库 前10条
1 李伟;黄颖;;基于HtmlParser的网页信息提取[J];兵工自动化;2007年07期
2 连雁平;;基于智能Agent的个性化搜索引擎模型研究[J];长江大学学报(自然科学版)理工卷;2010年01期
3 刘德仿;王斌;;面向教学领域的智能搜索引擎的研究与开发[J];电化教育研究;2007年05期
4 张斌;周尔宁;张丹阳;;SEO技术在网站开发中的应用[J];电脑编程技巧与维护;2009年14期
5 曾永川;;Agent技术研究综述[J];电脑知识与技术;2008年21期
6 徐素锦;赵新强;;基于Agent技术的数据挖掘模型研究[J];电脑知识与技术;2009年07期
7 韩志扬;孟晓景;;Web2.0 RIA基础类研究[J];福建电脑;2006年10期
8 石玮;周焱华;汪自云;;基于INTERNET的在线IP页面信息单元实时解析的设计与实现[J];福建电脑;2009年06期
9 连雁平;;基于智能agent的个性化搜索[J];佛山科学技术学院学报(自然科学版);2010年02期
10 李彦刚;魏海平;侯兴华;;基于HTMLParser的Web信息抽取系统的设计与实现[J];辽宁石油化工大学学报;2006年02期
中国重要会议论文全文数据库 前3条
1 张二梅;刘辰;杨正球;;基于HTMLParser自动生成测试用例的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
3 蒋国武;程新荣;罗长寿;;基于Agent的农业个性化搜索技术研究[A];“第二届国际计算机及计算技术在农业中的应用研讨会”暨“第二届中国农村信息化发展论坛”论文集[C];2008年
中国博士学位论文全文数据库 前6条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
3 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 张伯泉;人工智能及其在风—光互补发电场中的应用研究[D];广东工业大学;2007年
5 秦忠宝;基于混合知识表示的设计创新及知识获取研究[D];西北工业大学;2006年
6 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 陈晓慧;空间信息服务管理平台的设计与实现[D];山东科技大学;2010年
2 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
3 王乐超;Web环境下文献信息的提取与匹配研究[D];大连理工大学;2010年
4 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
5 邓磊;一个基于向量空间模型的个性化推荐系统[D];华东交通大学;2009年
6 赵红霞;数据挖掘技术和RSS技术在图书馆个性化服务中的应用[D];解放军信息工程大学;2008年
7 王艳;数字图书馆个性化中文文本信息服务系统研究[D];西南师范大学;2003年
8 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
9 张敏;基于Web挖掘的个性化信息检索研究[D];山东科技大学;2004年
10 许孟丽;虚拟企业知识管理系统的模型研究[D];大连海事大学;2005年
【二级参考文献】
中国期刊全文数据库 前1条
1 许建潮,胡明,时密林;文书类档案的主题标引研究[J];情报学报;1998年04期
【相似文献】
中国期刊全文数据库 前10条
1 贺全荣;;轻松解锁网页 随意复制粘贴[J];电脑迷;2011年12期
2 孙敏;;给网页遮羞 拒黄图通行[J];电脑迷;2011年18期
3 韦妍;;人脸表情识别概述[J];网络安全技术与应用;2011年08期
4 吴春辉;陈洪生;;基于内容的音频检索技术研究[J];咸宁学院学报;2011年06期
5 阚文浩;;巧制网页 在淘宝购物中赚“回扣”[J];电脑爱好者;2011年11期
6 黄伟光;;网页木马及其防范[J];保密科学技术;2011年05期
7 刘劲;陈瑛琦;扶晓;;虹膜特性提取阶段的小波多尺度特征量化算法[J];电脑编程技巧与维护;2011年14期
8 阎皓的皓;;选择性屏蔽网页中的音乐[J];电脑迷;2011年18期
9 胡进;胡桂明;毛世榕;;BP神经网络在说话者识别中的应用[J];装备制造技术;2011年09期
10 刘劲;赵蕾;扶晓;;基于小波模极值的虹膜特征提取算法[J];电脑编程技巧与维护;2011年16期
中国重要会议论文全文数据库 前10条
1 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 白清源;林锦贤;谢丽聪;;信息自动获取系统的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 冯艳卉;洪宇;颜振祥;姚建民;朱巧明;;基于搜索引擎的双语混合网页识别新方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 江志纲;丁增喜;刘洋;王大玲;鲍玉斌;于戈;;基于面向属性规约方法的网页和超链的分类[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
5 孔辉;梁洪亮;辛阳;杨义先;陈林顺;;一种高性能的网页篡改检测与恢复机制[A];2010年全国通信安全学术会议论文集[C];2010年
6 刘晖;赵萍;;新疆环境气象中心网站的总体规划及建设[A];信息技术在气象领域的开发应用论文集(一)[C];2005年
7 李立宗;高铁杠;陈蓉;陈超;;基于混沌系统的web信息隐藏研究与实现[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
8 王玉龙;叶新铭;李秀华;;网页优化策略的模糊C均值(FCM)聚类算法研究(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 朱建国;孙钟德;刘婷;;地市级网络管理监控初探[A];“推进气象科技创新,提高防灾减灾和应对气候变化能力”——江苏省气象学会第七届学术交流会论文集[C];2011年
10 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
中国重要报纸全文数据库 前10条
1 商报记者 金朝力;网页游戏繁华之后难掩衰落[N];北京商报;2009年
2 本报记者 廖庆升;网游巨头纷纷“涉水” 网页游戏面临洗牌[N];通信信息报;2009年
3 付燕;8000万元联合风投搅动网页游戏市场[N];中国高新技术产业导报;2009年
4 刘思齐;网页游戏的春天即将来临或将赶超大型网游[N];中国高新技术产业导报;2009年
5 商报记者 王可;网页游戏:网游下一座“金池”[N];北京商报;2010年
6 记者 施晓义 陈文文 通讯员 武长虹;陈伟星:撬开网页游戏大门[N];浙江日报;2010年
7 苏钺;网页游戏的第二次起跑[N];中国文化报;2009年
8 任晓宁;网页游戏何去何从[N];中国文化报;2010年
9 本报见习记者 任晓宁;“黄金3年”过后,网页游戏何去何从[N];中国新闻出版报;2010年
10 见习记者 任晓宁;网页游戏产值约30亿元 投资人看好未来前景[N];中国新闻出版报;2010年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
2 孙学刚;面向奥运的中文网页信息获取方法的初步研究[D];清华大学;2004年
3 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
4 王振华;基于非线性维数约减的模式识别[D];天津大学;2004年
5 史建涛;基于电阻点焊过程信号的点焊质量监控方法研究[D];兰州理工大学;2005年
6 王丹丹;DSP图像处理系统及其在糖厂分蜜机色值检测中的应用[D];广西大学;2005年
7 金莲芳;基于MPEG-7形状特征的图像检索技术研究[D];广西大学;2005年
8 陈琦;基于内容的图像检索中特征提取技术研究[D];浙江工业大学;2005年
9 高水平;织物疵点检测的图像处理技术[D];青岛大学;2005年
10 杨东;基于神经网络的语音识别鲁棒性研究[D];山东师范大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026