收藏本站
《计算机研究与发展》 2000年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种高效的中文电子词表数据结构

陈桂林  王永成  韩客松  王刚  
【摘要】:在分析中文字编码体系、中文词一些特点的基础上,文中提出了一种新的中文电子词表数据结构,并讨论了利用首字Hash 加二分查找的数据查找算法以及相关的数据更新、删除和插入算法. 理论分析和试验结果表明,利用文中方法构建的中文电子词表访问效率远优于现有的其它方法

手机知网App
【引证文献】
中国期刊全文数据库 前10条
1 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
2 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
3 李向阳,张亚非;一种Hash高速分词算法[J];解放军理工大学学报(自然科学版);2004年02期
4 马光志,李专;基于特征词的自动分词研究[J];华中科技大学学报(自然科学版);2003年03期
5 温滔,朱巧明,吕强;一种快速汉语分词算法[J];计算机工程;2004年19期
6 滕伟,王永成;智能代理技术在新一代搜索引擎中的应用[J];计算机工程;2000年S1期
7 韩客松,王永成,沈洲,吴芳芳;三个层面的中文文本主题自动提取研究[J];中文信息学报;2001年04期
8 韩客松,王永成,滕伟;Web页面中文文本主题的自动提取研究[J];情报学报;2001年02期
9 张科;;多次Hash快速分词算法[J];计算机工程与设计;2007年07期
10 吴绍根;;汉语自动分词模式自动机构造研究[J];现代图书情报技术;2006年05期
中国重要会议论文全文数据库 前1条
1 王虎;王潜平;;对整词二分自动分词机制的改进[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 钱铁云;关联文本分类关键技术研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 湛燕;K-近邻、K-均值及其在文本分类中的应用[D];河北大学;2003年
2 阚忠良;数字图书馆中基于结构和内容的文本信息检索技术的研究[D];黑龙江大学;2002年
3 王术;面向个性化服务的网页特征描述方法研究[D];重庆大学;2004年
4 马国俊;潜在语义索引在中文文本聚类中的应用研究[D];西安建筑科技大学;2004年
5 程传鹏;基于分类的智能信息检索研究与实现[D];云南师范大学;2005年
6 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
7 朱军;中文垃圾邮件过滤技术研究及应用[D];合肥工业大学;2005年
8 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
9 夏俊鸾;一个基于分类规则发现的汉语消歧方法的设计与实现[D];苏州大学;2006年
10 郭翠珍;基于网格的分词服务系统的研究与实现[D];苏州大学;2006年
【参考文献】
中国期刊全文数据库 前2条
1 孙文隽,李建中,常红;基于并行B~+-树的并行Join算法的设计、分析与实现[J];计算机学报;1998年01期
2 郭祥昊,钟义信,杨丽;基于两字词簇的汉语快速自动分词算法[J];情报学报;1998年05期
【共引文献】
中国期刊全文数据库 前10条
1 刘来旸,瞿有利,樊孝忠;汉语智能输入系统的设计[J];北京理工大学学报;2001年03期
2 亢世勇;《现代汉语新词语信息(电子)词典》的开发与应用[J];辞书研究;2001年02期
3 亢世勇;《现代汉语语法信息词典》的特点与不足[J];辞书研究;2001年06期
4 于源,衣袭;中文全切分快速分词方法[J];大连铁道学院学报;2005年02期
5 徐延勇,周献中,井祥鹤,郭忠伟;基于最大熵模型的汉语句子分析[J];电子学报;2003年11期
6 李良炎,何中市,易勇;基于词联接的语义表示方法和知识库建设[J];重庆大学学报(自然科学版);2004年04期
7 李良炎,何中市,易勇;基于词联接的语义分析原理及其算法[J];重庆大学学报(自然科学版);2004年08期
8 徐志明,王晓龙,姜守旭;一种语句级汉字输入技术的研究[J];高技术通讯;2000年01期
9 蓝庆元,任海波;计算语言学概说[J];桂林师范高等专科学校学报;2001年04期
10 昝红英,俞士汶;CCD及其应用[J];广西师范大学学报(自然科学版);2003年01期
中国重要会议论文全文数据库 前2条
1 邢红兵;;面向对外汉语教学的动词用法频率词典[A];对外汉语学习词典学国际研讨会论文集[C];2005年
2 熊文;张玲;;一种基于规则不依赖于分词的中文数量短语的识别[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
2 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
3 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
4 张蕾;概念结构及其应用[D];西北工业大学;2001年
5 樊中元;现代汉语一名多量现象研究[D];湖南师范大学;2003年
6 郭忠伟;作战文书自动生成理论及方法研究[D];南京理工大学;2003年
7 杨峰;分布式并行索引研究[D];电子科技大学;2003年
8 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
9 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
10 刁晏斌;虚义动词论[D];南开大学;2004年
中国硕士学位论文全文数据库 前10条
1 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
2 王春霞;基于语料库的离合词研究[D];北京语言文化大学;2001年
3 陈先华;自然语言理解之汉语量词和名词搭配及查错系统[D];电子科技大学;2002年
4 李辉阳;面向CAI的简述文字判读技术及其应用研究[D];湘潭大学;2002年
5 王立霞;现代汉语介词短语边界识别研究[D];北京语言文化大学;2003年
6 崔尔胜;《水浒全传》量词研究[D];广西大学;2003年
7 张少平;基于结构化自然语言的算法规约研究[D];江西师范大学;2003年
8 由丽萍;动词与动词搭配自动获取方法研究[D];上海师范大学;2003年
9 李娜;面向作战文书智能处理的电子词典的研究与实现[D];南京理工大学;2003年
10 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
【同被引文献】
中国期刊全文数据库 前10条
1 程节华;自动分词中的歧义字段分析及处理[J];安徽农业技术师范学院学报;2000年03期
2 丁丰,董娜,林碧琴,袁保宗;自然语言处理系统中自动分词的研究[J];北方交通大学学报;1999年06期
3 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
4 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
5 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
6 李业丽;秦臻;;一种改进的k-means算法[J];北京印刷学院学报;2007年02期
7 原福永,李莉,李红岩;智能信息检索的设计与研究[J];燕山大学学报;2005年04期
8 武胜良;;数据挖掘中模糊聚类方法在信息检索中的应用[J];当代经理人(中旬刊);2006年15期
9 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
10 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
中国博士学位论文全文数据库 前4条
1 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
2 梁晟;基于语义Web的服务自动组合技术的研究[D];中国科学院研究生院(软件研究所);2004年
3 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
4 顾芳;多学科领域本体设计方法的研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前10条
1 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
2 林云;关于需求分析建模与模型验证技术的研究[D];华中师范大学;2001年
3 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
4 麻春艳;基于OGSA的网格服务的应用研究[D];河海大学;2004年
5 冯兰萍;本体在智能信息检索系统中的应用研究[D];河海大学;2005年
6 李卫红;一种新的并发分词算法的研究与实现[D];山东大学;2005年
7 俞庆英;联机手写汉字识别系统的研究与实现[D];安徽大学;2005年
8 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
9 周蕾;中文未登录词识别的研究及在汉字输入法中的应用[D];苏州大学;2005年
10 张江;本体在领域知识管理中的应用研究[D];重庆大学;2005年
【二级引证文献】
中国期刊全文数据库 前10条
1 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
2 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期
3 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期
4 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
5 刘晓英;汉语自动分词研究的发展趋势[J];高校图书馆工作;2005年04期
6 邸书灵,赵志宏,雷宇,姚雄伟;基于自然语言理解的ISO标准WEB智能咨询系统研究[J];河北工业大学学报;2004年05期
7 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
8 林绮屏;基于词形的最佳路径分词算法[J];华南师范大学学报(自然科学版);2002年04期
9 李向阳,张亚非;一种Hash高速分词算法[J];解放军理工大学学报(自然科学版);2004年02期
10 李向阳,张亚非;基于语义标注的信息抽取[J];解放军理工大学学报(自然科学版);2004年04期
中国重要会议论文全文数据库 前1条
1 王虎;王潜平;;对整词二分自动分词机制的改进[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前4条
1 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
2 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
3 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
4 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 薛鹏军;基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D];南京农业大学;2001年
2 陈红英;Internet信息过滤Agent的研究和实现[D];广东工业大学;2002年
3 冯元勇;智能搜索器的概念库设计及其文档评价策略[D];中南大学;2002年
4 贾建华;语音合成及语音处理[D];中南大学;2002年
5 李丽苹;教学电子信息资源管理研究[D];南京师范大学;2002年
6 傅赛香;基于Internet的智能信息检索技术研究[D];广西师范大学;2002年
7 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
8 杨明;面向空间数据的专题文本数据挖掘技术的研究[D];北京工业大学;2002年
9 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
10 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
【二级参考文献】
中国期刊全文数据库 前4条
1 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
2 骆正清,陈增武,胡上序;一种改进的MM分词方法的算法设计[J];中文信息学报;1996年03期
3 张民,李生,王海峰,赵铁军,王铁志;基于知识评价的快速汉语自动分词系统[J];情报学报;1996年02期
4 苏新宁;汉语词切分标引算法的改进[J];情报学报;1996年06期
【相似文献】
中国硕士学位论文全文数据库 前5条
1 张恂;嵌入式数据库在Garfield系统中的应用与研究[D];东南大学;2006年
2 向迎;基于Windows CE.net的嵌入式英蒙汉电子词典的研究[D];内蒙古大学;2006年
3 杨中华;基于Qt/Embedded的SQLite数据库研究及应用[D];西华大学;2008年
4 章剑涛;并行数据仓库环境下基于B~+树的分布式索引研究[D];燕山大学;2010年
5 邢伟;基于B~+树的移动对象索引研究[D];复旦大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026