收藏本站
《微计算机信息》 2008年24期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于中文信息处理的古代汉语分词研究

邱冰  皇甫娟  
【摘要】:本文在计算机语言处理与古代汉语词汇研究的交叉学科领域进行了新的探索,提出了一种基于计算机自动分词的词汇处理及量化统计方法,并给出了具体的实现方式。统计结果显示,古代汉语双音词比重自先秦以来以一种平稳的方式增长,该结论与古代汉语词汇研究成果一致。本文提出的方法具有良好的合理性和高效的处理性能,在一定程度上克服了传统人工分词方法的缺陷和不足,因而计算机自然语言处理在古代汉语研究中也有重要的应用价值。
【作者单位】北京大学中文系;河南工程学院图书馆;
【分类号】:TP391.1

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 赵成龙,薛欣;基于WEB的智能答疑系统的设计与实现[J];安阳师范学院学报;2004年02期
2 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期
3 杨晓江;李丽娟;田俊华;李艺;;面向基础教育的Web资源垂直服务体系研究[J];中国远程教育;2006年07期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
6 陈榕;自动分词、标引与智能检索在信访业务处理中的应用[J];福建电脑;2003年10期
7 王挺;麦范金;刘忠;;自然语言处理及其应用前景的研究[J];桂林航天工业高等专科学校学报;2006年04期
8 刘挺,吴岩,王开铸;中文自动文摘系统CAAS的研究与实现[J];哈尔滨工业大学学报;1999年06期
9 冯志伟;;当前自然语言处理发展的几个特点[J];暨南大学华文学院学报;2006年01期
10 季永华,许华虎,沈敏,万杰;自动答疑系统的研究与实现[J];计算机工程与应用;2005年14期
中国重要会议论文全文数据库 前8条
1 李玉良;王良松;李晶;;图像中数字字符识别技术概览[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
2 邹纲;刘洋;刘群;孟遥;于浩;西野文人;亢世勇;;面向Internet的中文新词语检测[A];2004年辞书与数字化研讨会论文集[C];2004年
3 曾依灵;许洪波;;网络热点信息发现研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
4 朱江涛;蔡东风;张桂平;;一种基于网络的英文缩略语信息的自动抽取方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 郎君;刘挺;张会鹏;李生;;LTP:语言技术平台[A];第三届学生计算语言学研讨会论文集[C];2006年
6 郎君;刘挺;李生;张会鹏;;基于XML的开放式语言技术平台:LTP[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 钟茂生;;自然语言中的对象及其处理[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
3 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
4 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
5 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
6 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
7 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
8 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
9 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
10 方淼;语义单元自动获取研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
2 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
3 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
4 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
5 李辉阳;面向CAI的简述文字判读技术及其应用研究[D];湘潭大学;2002年
6 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年
7 宗士强;潜在语义索引在飞机故障案例检索的中应用[D];南京航空航天大学;2003年
8 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
9 杨明;面向空间数据的专题文本数据挖掘技术的研究[D];北京工业大学;2002年
10 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
【二级参考文献】
中国期刊全文数据库 前2条
1 李蓉,刘少辉,叶世伟,史忠植;基于SVM和k-NN结合的汉语交集型歧义切分方法[J];中文信息学报;2001年06期
2 李珩,朱靖波,姚天顺;基于SVM的中文组块分析[J];中文信息学报;2004年02期
【相似文献】
中国期刊全文数据库 前10条
1 陈明远,管汀鹭;打字能比说话更快——几种高速键盘的设计[J];自然杂志;1980年08期
2 钱锋;计算语言学[J];自然杂志;1980年04期
3 陈明远;;电子计算机中文信息处理探讨[J];计算机研究与发展;1980年09期
4 ;《语文现代化》丛刊创刊[J];民族语文;1980年02期
5 王世宁;差错率在中文信道中对信息传输的影响[J];山西大学学报(自然科学版);1981年01期
6 ;汉字终端显示概述及整管方案选定[J];电子器件;1982年01期
7 ;学术活动[J];计算机学报;1982年06期
8 郑苏民,张懋询;用微型计算机实现汉字信息处理[J];计算机应用;1982年03期
9 ;资料消息[J];微型机与应用;1982年02期
10 怡林;中国中文信息研究会召开新春学术座谈会[J];计算机研究与发展;1983年04期
中国重要会议论文全文数据库 前10条
1 陆汝占;靳光瑾;;寻求对外汉语教学和计算机共同适用的语义解释方法[A];第五届国际汉语教学讨论会论文选[C];1996年
2 刘芳;乔谊正;;一种用于联机中文签名识别系统的签名产生模型[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
3 高军;陈锡先;;汉语语料中对未知词汇的自动提取[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
4 汪华峰;陈峪;;汉语自然语言理解中词切分中新词问题初探[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
5 于鸿洋;苟大举;贺德珏;杨家沅;;连续汉语语音合成的研究[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
6 莫锦贤;马常楼;;文本文件转换成语音文件及其合成输出[A];第二届全国人机语音通讯学术会议论文集[C];1992年
7 苟大举;杨启纲;贺德珏;;TSP53C30语音合成系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
8 沈阳;顾阳;;汉语合成复合词的词库和句法界面特征[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 郑家恒;李文花;;新词语自动识别方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 单永明;;汉语文本的篇章结构及其标引算法的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 王周文;汉字学教育学专家关注小学识字教学[N];中国教育报;2000年
2 柯技;IT产业推动经济结构调整[N];中国矿业报;2000年
3 ;形形色色的中文输入法[N];中国信息报;2000年
4 张长明;语言:人类文明的标志[N];安徽日报;2001年
5 李健;反病毒软件:抢占市场突破口[N];中国电力报;2001年
6 刘萍;我国中文信息处理技术达到新水平[N];中国电子报;2001年
7 国家标准化管理委员会主任助理 宿忠民;加快标准化步伐 促进高新技术产业发展[N];中国国门时报(中国出入境检验疫报);2001年
8 金非;嵌入技术创造未来[N];经济日报;2001年
9 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
10 本报记者 贺力;机遇和忧患[N];中国消费者报;2001年
中国博士学位论文全文数据库 前5条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年
3 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
4 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
5 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
中国硕士学位论文全文数据库 前10条
1 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
2 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
3 郭卉萍;基于Java的网络中文平台的研究与实现[D];西安电子科技大学;2001年
4 吴传喜;一种面向Internet的中文应用支撑平台的研究与实现[D];西安电子科技大学;2001年
5 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
6 程丽芳;基于Ada95的语言识别器生成器的研究[D];西安电子科技大学;2001年
7 张驰;Web信息获取技术研究与实现[D];西北工业大学;2001年
8 余露;科技论文DTD的设计及其XML文档生成[D];苏州大学;2001年
9 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
10 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026