收藏本站
《计算机应用》 2006年S2期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于改进的隐马尔科夫模型的汉语词性标注

王敏  郑家恒  
【摘要】:基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系。还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型。实验结果证明,改进后的模型明显优于传统HMM词性标注模型的效果。

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 梁以敏,黄德根;基于完全二阶隐马尔可夫模型的汉语词性标注[J];计算机工程;2005年10期
2 张孝飞,陈肇雄,黄河燕,蔡智;词性标注中生词处理算法研究[J];中文信息学报;2003年05期
3 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
4 徐望,王炳锡;N-gram语言模型中的插值平滑技术研究[J];信息工程大学学报;2002年04期
【共引文献】
中国期刊全文数据库 前10条
1 黄永文,何中市;基于全局折扣的统计语言模型平滑技术[J];重庆大学学报(自然科学版);2005年08期
2 魏欧,孙玉芳;基于非监督训练的汉语词性标注的实验与分析[J];计算机研究与发展;2000年04期
3 高升,王晓龙;语句级汉字输入系统中语义规则研究[J];计算机工程与应用;2003年04期
4 高升,徐志明;统计语言模型中词的自动聚类技术研究[J];计算机工程与应用;2003年11期
5 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
6 方华,陆汝占,刘绍明;一个实现多种切分标注算法的系统[J];计算机工程;2004年24期
7 梁以敏,黄德根;基于完全二阶隐马尔可夫模型的汉语词性标注[J];计算机工程;2005年10期
8 陈天莹;陈蓉;潘璐璐;李红军;于中华;;基于前后文n-gram模型的古汉语句子切分[J];计算机工程;2007年03期
9 张虎,郑家恒,刘江;汉语语料库词性标注自动校对方法研究[J];计算机应用;2005年01期
10 谈文蓉;符红光;刘莉;杨宪泽;;一种基于贝叶斯分类与机读词典的多义词排歧方法[J];计算机应用;2006年06期
中国博士学位论文全文数据库 前10条
1 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
2 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
3 徐望;连续语音识别的稳健性技术研究[D];解放军信息工程大学;2006年
4 雷震;基于事件的新闻报道分析技术研究[D];国防科学技术大学;2006年
5 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
6 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
7 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
8 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
9 孙凌云;面向产品概念设计的专利地图技术研究[D];浙江大学;2008年
10 方淼;语义单元自动获取研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
2 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
3 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
4 关真珍;基于半督导机器学习的分词算法的设计与实现[D];华中科技大学;2004年
5 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
6 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
7 顾平;一种智能型数码输入技术的研究与设计[D];苏州大学;2005年
8 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
9 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
10 杨军玲;汉语动词词语搭配自动获取方法研究[D];山西大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
2 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期
3 冯书晓,徐新,杨春梅;国内中文分词技术研究新进展[J];情报杂志;2002年11期
4 刘万代;马新明;;社会主义新农村建设中农业信息化发展研究[J];安徽农业科学;2006年12期
5 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
6 赵岩;王晓龙;刘秉权;关毅;;融合聚类触发对特征的最大熵词性标注模型[J];计算机研究与发展;2006年02期
7 王素格,张永奎;汉语词性标注排歧方法探讨[J];计算机工程与应用;2001年07期
8 李跃进;赵晶;林鸿飞;;基于Internet的军事演习信息抽取系统[J];计算机工程与应用;2006年14期
9 洪铭材;张阔;唐杰;李涓子;;基于条件随机场(CRFs)的中文词性标注方法[J];计算机科学;2006年10期
10 梁以敏,黄德根;基于完全二阶隐马尔可夫模型的汉语词性标注[J];计算机工程;2005年10期
中国博士学位论文全文数据库 前10条
1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
2 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
3 强保华;异构数据库语义集成技术研究[D];重庆大学;2005年
4 黄茂军;地理本体的形式化表达机制及其在地图服务中的应用研究[D];武汉大学;2005年
5 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
6 于海波;基于规则和本体的应用安全策略研究[D];吉林大学;2006年
7 林松涛;模块化本体建设研究[D];北京邮电大学;2006年
8 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
9 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
10 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
2 艾丹祥;基于本体论的知识检索研究[D];武汉大学;2004年
3 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
4 张校乾;基于Lucene的全文检索系统的研究与应用[D];大连理工大学;2005年
5 刘平冰;基于Lucene的Web站内信息搜索系统[D];电子科技大学;2005年
6 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
7 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
8 王晓燕;面向特定领域的需求获取与分析技术研究[D];山东大学;2006年
9 熊晶;P2P环境下基于Ontology的搜索引擎[D];中国海洋大学;2006年
10 张俊;基于内容的汉语文献信息检索系统的设计与实现[D];南京农业大学;2006年
【二级参考文献】
中国期刊全文数据库 前3条
1 陈志忠,陈肇雄,高庆狮;通用的自然语言词法分析机制[J];计算机学报;1991年02期
2 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
3 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期
2 刘兴林;郑启伦;马千里;;中文合成词识别及分词修正[J];计算机应用研究;2011年08期
3 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期
4 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
5 努尔比娅·塔依尔;地里木拉提·吐尔逊;艾斯卡尔·肉孜;;面向韵律层边界自动划分的维吾尔语词性自动标注技术研究[J];计算机应用与软件;2011年08期
6 姜文斌;吴金星;乌日力嘎;那顺乌日图;刘群;;蒙古语有向图形态分析器的判别式词干词缀切分[J];中文信息学报;2011年04期
7 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
8 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
9 顾潇华;姜亦强;崔涛;;中文自动标引、全文检索及中文搜索引擎三者关系的探讨[J];图书馆学研究;2011年17期
10 张尊生;;《信息技术 信息交换用汉字编码字符集 基本集的扩充》和《信息技术 数字键盘汉字输入通用要求》国家标准发布[J];中国标准导报;2000年03期
中国重要会议论文全文数据库 前10条
1 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 江丰;刘慧;陈玉泉;陆汝占;;一个可扩展的汉语词法和句法分析一体化系统[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
6 郭慧志;刘华;谢学敏;张普;;《人民日报》标注语料的初步统计分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
8 朱莉;孟遥;赵铁军;;典型参数平滑算法在词性标注中的性能评价[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
4 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
5 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
6 许伟;金友兵 破局国外办公套件垄断[N];中国企业报;2008年
7 ;浙江天宇信息技术有限公司[N];中国计算机报;2009年
8 中文信息学会课题组;如何提高国产手机汉字输入法的市场竞争力[N];语言文字周报;2007年
9 梵欣;两项信息技术国家标准发布[N];中国包装报;2000年
10 中文信息学会课题组;如何提高国产手机汉字输入法的市场竞争力[N];光明日报;2007年
中国博士学位论文全文数据库 前10条
1 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
2 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
3 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
4 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
5 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
6 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
7 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
8 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
9 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
10 袁彩霞;中文功能组块分析及应用研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 罗丽俊;中文信息处理中若干技术的研究与实现[D];辽宁科技大学;2008年
3 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
4 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
5 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
6 秦健;N-gram技术在中文词法分析中的应用研究[D];中国海洋大学;2009年
7 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
8 朱江涛;中文信息处理中命名实体识别问题的研究[D];沈阳航空工业学院;2006年
9 沈威;基于渡越矩阵与语境计算模型的复句关系词的自动标注[D];华中师范大学;2007年
10 李东海;数据挖掘技术在远程教学系统中的应用研究[D];首都师范大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026