收藏本站
《华章》 2011年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

网页文本自动分词的有词典方法

付海辰  
【摘要】:本文介绍了汉语自动分词和网络语言的特点,利用双字哈希索引分词词典机制进行汉语分词,证明其方法的有效性。
【作者单位】唐山学院计算机科学与技术系;
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 李烁;基于本体自动创建的智能查询研究[D];湖南大学;2012年
【参考文献】
中国期刊全文数据库 前2条
1 龚静;周经野;;一种基于多重因子加权的文本特征项权值计算方法[J];计算技术与自动化;2007年01期
2 张培颖;李村合;;一种中文分词词典新机制——四字哈希机制[J];微型电脑应用;2006年10期
【共引文献】
中国期刊全文数据库 前10条
1 张林曼;吴升;;地理编码系统中地名地址分词算法研究[J];测绘科学;2010年02期
2 赵小华;马建芬;;文本分类算法中词语权重计算方法的改进[J];电脑知识与技术;2009年36期
3 马婷婷;;中文自动分词系统概述[J];电脑知识与技术;2010年33期
4 周军;王艳红;;一种基于词典的中文分词法的设计与实现[J];黑龙江科技信息;2008年25期
5 段丹;郭绍忠;甄涛;刘晓楠;;基于数据库编程语言的海量邮件数据分类技术[J];计算机工程;2008年09期
6 李学明;李海瑞;薛亮;何光军;;基于信息增益与信息熵的TFIDF算法[J];计算机工程;2012年08期
7 高飞;周学广;孙艳;;基于关联规则和粗糙集的话题特征提取方法[J];计算机工程;2012年10期
8 蒋才智;王浩;;基于memcached的动态四字双向词典机制[J];计算机应用研究;2011年01期
9 林明才;康耀红;钟声;张诚;;文本聚类技术在科研立项管理中的应用[J];科技管理研究;2009年10期
10 韩莹;丰继林;袁静;王茂发;张艳霞;陈福明;陈新房;潘志安;;基于二进制串的Trie索引树分词词典机制的研究[J];计算机与现代化;2013年01期
中国硕士学位论文全文数据库 前10条
1 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
2 卢育红;半结构化药物数据智能分类技术研究与系统实现(全日制专业学位)[D];北京交通大学;2011年
3 蒋才智;中文自动分词及人名识别技术研究[D];合肥工业大学;2011年
4 黎源;基于粗糙集的中文文本分类在邮件过滤中的研究[D];暨南大学;2011年
5 董慧;基于多元权重特征加权的中文文本分类算法[D];中北大学;2011年
6 苑春燕;基于过滤技术的投诉信息智能分析与实现[D];沈阳理工大学;2011年
7 魏博诚;中文分词交集型歧义处理研究[D];安徽大学;2011年
8 索南扎西;藏语语音合成关键技术研究[D];西藏大学;2011年
9 赵丽;基于双字哈希的PAT树词典机制的研究[D];哈尔滨工程大学;2011年
10 叶继平;基于Lucene的全文信息检索技术的研究与应用[D];江南大学;2012年
【同被引文献】
中国期刊全文数据库 前10条
1 李东普;麦范金;史慧;;基于语义理解的中文智能检索模型研究[J];桂林航天工业高等专科学校学报;2010年01期
2 刘挺,吴岩,王开铸;最大概率分词问题及其解法[J];哈尔滨工业大学学报;1998年06期
3 任伟;;基于本体和数据挖掘技术的智能授导系统研究[J];黑龙江科技信息;2008年34期
4 吕艳辉;马宗民;王玉喜;;基于关系数据库的OWL本体构建方法的研究[J];计算机科学;2009年07期
5 张国强;贾素玲;王强;;基于OWL DL的关系数据知识提取研究[J];计算机科学;2010年03期
6 陈斌;;基于数学设计的计算机自动分词算法[J];江西科学;2009年05期
7 韩客松,王永成,陈桂林;汉语语言的无词典分词模型系统[J];计算机应用研究;1999年10期
8 肖明;胡金柱;肖毅;;面向智能搜索引擎的本体学习研究[J];计算机应用研究;2008年08期
9 梁刚;基于机械分词与统计学的新词识别研究[J];情报理论与实践;2005年05期
10 张娜;张玉花;李宝敏;;基于本体实现有效语义智能检索系统研究[J];情报杂志;2008年03期
中国博士学位论文全文数据库 前5条
1 周栩;本体工程中若干问题的研究[D];吉林大学;2011年
2 唐素勤;面向语义Web的描述逻辑本体构建[D];中南大学;2011年
3 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
4 郝兴伟;基于知识本体的E-learning系统研究[D];山东大学;2007年
5 刘志勇;基于本体的自适应学习方法及应用研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前8条
1 韩艳;基于关系数据库的本体构建方法研究[D];内蒙古科技大学;2010年
2 屈喜龙;基于Web的智能查询系统的研究[D];昆明理工大学;2003年
3 李宁;用知识挖掘技术实现网络信息的学科知识分类与智能查询[D];四川大学;2003年
4 黄海;异构数据集成系统中的智能查询研究及实现[D];大连海事大学;2004年
5 李美子;智能查询技术的研究与应用[D];山东科技大学;2005年
6 郑任儿;基于本体的语义检索技术研究[D];华东师范大学;2007年
7 魏勇刚;Deep Web数据抽取及语义标注研究[D];河北大学;2009年
8 张成;智能查询系统中的需求理解[D];上海交通大学;2007年
【二级参考文献】
中国期刊全文数据库 前4条
1 马颖华,王永成,苏贵洋,张宇萌;一种基于字同现频率的汉语文本主题抽取方法[J];计算机研究与发展;2003年06期
2 孙茂松,左正平,黄昌宁;汉语自动分词词典机制的实验研究[J];中文信息学报;2000年01期
3 李庆虎,陈玉健,孙家广;一种中文分词词典新机制——双字哈希机制[J];中文信息学报;2003年04期
4 邹娟,周经野,邓成,高南莎;特征词提取中同义处理的新方法[J];中文信息学报;2005年06期
【相似文献】
中国期刊全文数据库 前10条
1 徐进鸿,邵品洪,李明霞;情报检索数学模型及若干技术进展[J];现代图书情报技术;1990年03期
2 高洁羽,吕强,杨季文,钱培德;自动分词在输入法测试系统中的应用[J];电化教育研究;2003年02期
3 王彩荣;汉语自动分词专家系统的设计与实现[J];微处理机;2004年03期
4 刘开瑛;现代汉语自动分词评测技术研究[J];语言文字应用;1997年01期
5 王彩荣,李晓毅,黄玉基;汉语自动分词系统的评价[J];微处理机;2003年05期
6 徐华中;徐刚;;一种新的汉语自动分词算法的研究和应用[J];计算机与数字工程;2006年02期
7 黄昌宁;自动分词[J];语言文字应用;1997年01期
8 王巍;;基于Perl的汉语自动分词算法研究[J];中州大学学报;2007年01期
9 罗洋;;汉语自动分词方法的综述[J];科技信息;2009年07期
10 陈顺强;;彝文自动分词技术研究[J];中文信息学报;2011年03期
中国重要会议论文全文数据库 前10条
1 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 李小明;王亚莉;易立夫;杨静;孙金城;;自动分词中的单字虚词处理[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
3 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 孙承杰;黄昌宁;关毅;;基于标注语料库的组合歧义检测与消解[A];第三届学生计算语言学研讨会论文集[C];2006年
5 高璐;陈琪;李永宏;于洪志;;藏语语音合成中本文分析的若干问题研究[A];第九届中国语音学学术会议论文集[C];2010年
6 黄昌宁;林娟;孙承杰;;何谓金本位[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 郑泽之;;中文自动分词的一些问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
10 罗智勇;宋柔;荀恩东;;一种基于可信度的人名识别方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前5条
1 王萍;Web文本的知识化管理[N];计算机世界;2006年
2 教育部语信司;语言资源监测与服务论坛举行[N];语言文字周报;2010年
3 田梦;软件篇软件只是工具[N];计算机世界;2007年
4 实习生 康晨;网络没有唯一:国内中文搜索引擎之比较[N];中国消费者报;2005年
5 教育部语信司;国家语言资源监测与研究中心召开2007数据发布专题研讨会[N];语言文字周报;2008年
中国博士学位论文全文数据库 前2条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
2 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 许荣荣;中文文本自动分词技术与算法研究[D];郑州大学;2010年
2 普布旦增;藏文自动分词技术方法研究[D];西藏大学;2010年
3 段倩倩;面向信息处理的带典型前缀派生词的识别分析[D];上海师范大学;2010年
4 史迎馨;建筑图中有限自然语言的分析与理解的研究[D];长春工业大学;2010年
5 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
6 刘宽;现代汉语自动分词歧义分析及其消歧处理研究[D];兰州理工大学;2006年
7 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
8 付蕾;知识元标引系统的设计与实现[D];华中师范大学;2009年
9 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
10 张敏;基于Internet的个性化信息检索关键技术研究[D];燕山大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026