收藏本站
《长春工业大学学报(自然科学版)》 2007年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于隐Markov模型汉语词性自动标注的若干分析与改进

王东海  赵伟  陈洁  梁贺  
【摘要】:提出一种算法,用来高效地完成训练语料的大量工作,并解决好训练语料的扩充问题,然后基于Viterbi算法提出一些改进之策,结合训练语料工作完成后的结果在二元模型基础上,采用不同规模的训练语料对同一规模的测试语料进行测试、比较与分析,并提出模型的改进方向。

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 贺桂华;;语词性标注方法比较[J];怀化学院学报(自然科学);2008年01期
中国硕士学位论文全文数据库 前3条
1 程英迅;基于军事本体的智能检索引擎研究[D];电子科技大学;2010年
2 卢杰;基于中文文字情感识别系统的研究[D];西华大学;2008年
3 周辉;基于WEB挖掘的双语对获取技术研究[D];天津大学;2009年
【参考文献】
中国期刊全文数据库 前7条
1 王素格,张永奎;汉语词性标注排歧方法探讨[J];计算机工程与应用;2001年07期
2 胡春静,韩兆强;基于隐马尔可夫模型(HMM)的词性标注的应用研究[J];计算机工程与应用;2002年06期
3 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
4 梁以敏,黄德根;基于完全二阶隐马尔可夫模型的汉语词性标注[J];计算机工程;2005年10期
5 孙茂松,卢红娜,邹嘉彦;基于隐Markov模型的汉语词类自动标注的实验研究[J];清华大学学报(自然科学版);2000年09期
6 王挺,陈火旺,杨谊,史晓东;一种自适应词性标注方法[J];软件学报;1997年12期
7 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
【共引文献】
中国期刊全文数据库 前10条
1 赵红丹;王希杰;;基于隐马尔科夫模型的词性标注[J];安阳师范学院学报;2010年05期
2 丁丰,董娜,林碧琴,袁保宗;自然语言处理系统中自动分词的研究[J];北方交通大学学报;1999年06期
3 张晓君;;为什么语言学研究离不开逻辑学——2009语言学和逻辑学交叉研究研讨会侧记[J];毕节学院学报;2010年05期
4 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
5 郭涛;曲宝胜;郭勇;;自然语言处理中的模型[J];电脑学习;2011年02期
6 卢微;;隐马尔可夫模型在自然语言理解研究中的应用[J];电脑与信息技术;2007年01期
7 张磊;张代远;;中文分词算法解析[J];电脑知识与技术;2009年01期
8 李朝虹,陆建湖;现代汉语自动分析研究现状综述[J];广西教育学院学报;2003年01期
9 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
10 金新生;;句法分析与消解PCFG改进[J];电子设计工程;2012年04期
中国重要会议论文全文数据库 前9条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 朱学锋;俞士汶;李峰;;汉语语素库的构造及其同语法信息词典的集成[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
3 彭子平;张严虎;潘露露;;隐马尔科夫模型原理及其重要应用[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
4 隋岩;张普;;基于“动态流通语料库”进行“有效字符串”提取的初步研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
7 邢富坤;宋柔;罗智勇;;SSD模型及其在词性标注中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
9 赵伟;王美艳;刘闯;;基于古汉语语料数据库词的划分方法研究与探索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
4 宋今;面向网络实时翻译的双语信息管理系统BLIMS设计[D];中国科学院研究生院(计算技术研究所);1998年
5 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
6 夏天;研究性学习支持系统[D];华东师范大学;2007年
7 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
8 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
9 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
10 王志栋;语用要点识别模型研究[D];清华大学;2008年
中国硕士学位论文全文数据库 前10条
1 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
2 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
3 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年
4 苏俊峰;基于HMM的藏语语料库词性自动标注研究[D];西北民族大学;2010年
5 成少梅;利用IRF模型丰富文档的语义代表[D];武汉理工大学;2010年
6 陈磊;用例图到顺序图转换的研究[D];西安电子科技大学;2009年
7 朱颖;基于HMM的汉语词性标注及其改进[D];太原理工大学;2011年
8 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
9 文星;基于位置感知的Web文本搜索技术研究[D];大连海事大学;2011年
10 吴金星;蒙古语词法标注语料库的构建及相关技术研究[D];内蒙古大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 王志良;人工心理学──关于更接近人脑工作模式的科学[J];北京科技大学学报;2000年05期
2 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
3 王玉洁,王志良,陈锋军,王国江,王玉锋;基于隐马尔可夫模型的情感建模[J];北京农学院学报;2005年01期
4 郭丽娟;;浅谈情感计算[J];福建电脑;2006年02期
5 杨沐昀;A Research on Bilingual Dictionary Based Sentence Alignment for Chinese English Parallel Corpus[J];High Technology Letters;2002年01期
6 杜世平;混合隐马尔可夫模型Baum-Welch算法的改进[J];广西师范学院学报(自然科学版);2005年03期
7 魏欧,孙玉芳;基于非监督训练的汉语词性标注的实验与分析[J];计算机研究与发展;2000年04期
8 马希文;;自然语言理解[J];计算机工程与应用;1987年04期
9 胡春静,韩兆强;基于隐马尔可夫模型(HMM)的词性标注的应用研究[J];计算机工程与应用;2002年06期
10 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
中国博士学位论文全文数据库 前10条
1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
2 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
3 强保华;异构数据库语义集成技术研究[D];重庆大学;2005年
4 黄茂军;地理本体的形式化表达机制及其在地图服务中的应用研究[D];武汉大学;2005年
5 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
6 于海波;基于规则和本体的应用安全策略研究[D];吉林大学;2006年
7 林松涛;模块化本体建设研究[D];北京邮电大学;2006年
8 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
9 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
10 曾庆田;数学概念的知识获取与分析方法研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
2 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
3 艾丹祥;基于本体论的知识检索研究[D];武汉大学;2004年
4 朱代华;基于分词技术的智能答疑系统[D];重庆大学;2004年
5 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
6 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
7 谢坤;基于多Agent的和谐人机交互系统的研究与构建[D];天津师范大学;2005年
8 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
9 庞文俊;基于EHMM模型的人脸识别算法研究[D];西北工业大学;2006年
10 王晓燕;面向特定领域的需求获取与分析技术研究[D];山东大学;2006年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 陆韵;我国八套小学语文教科书儿童形象比较研究[D];浙江师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前3条
1 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
2 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
3 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 袁里驰,钟义信;一种新颖的词性标注模型[J];微电子学与计算机;2005年09期
2 刘洁彬;宋茂强;赵方;杨志宇;;基于上下文的二阶隐马尔可夫模型[J];计算机工程;2010年10期
3 陈鹏;古丽拉.阿东别克;;隐马尔可夫模型在维吾尔语词性标注中的应用[J];电脑知识与技术(学术交流);2006年11期
4 李荣;郑家恒;;一种改进Viterbi算法的应用研究[J];计算机工程与设计;2007年03期
5 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
6 王素格,张永奎;汉语词性标注排歧方法探讨[J];计算机工程与应用;2001年07期
7 侯呈风;古丽拉·阿东别克;;改进的HMM应用于哈萨克语词性标注[J];计算机工程与应用;2010年36期
8 孙静;李军辉;周国栋;;基于条件随机场的无监督中文词性标注[J];计算机应用与软件;2011年04期
9 艳红;王斯日古楞;;基于HMM的蒙古文自动词性标注研究[J];内蒙古师范大学学报(自然科学汉文版);2010年02期
10 付国宏,王晓龙,姜守旭;一种启发式的汉语词性标注算法[J];计算机工程与设计;2000年05期
中国重要会议论文全文数据库 前10条
1 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 赵大明;;关于《现代汉语规范字典》的词性标注[A];中国辞书论集1999[C];1999年
3 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 林红;胡欣;;最大熵模型的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
7 邢富坤;宋柔;罗智勇;;SSD模型及其在词性标注中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 石民;陈小荷;于丽丽;李斌;;基于CRF的古汉语分词标注一体化研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
10 李红印;;颜色词的收词、释义和词性标注[A];中国辞书论集2001[C];2001年
中国重要报纸全文数据库 前6条
1 孟传良;略谈汉外词典的修订[N];中国图书商报;2005年
2 王小宁;辞书应慎用“规范”冠名[N];人民政协报;2004年
3 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
4 北京大学中文系 陆俭明;要对广大读者负责[N];中国社会科学院院报;2004年
5 语言所 董琨;错误百出 贻笑大方[N];中国社会科学院院报;2004年
6 记者 黄小希;部分电子词典内容“缩水”“注水”严重[N];新华每日电讯;2011年
中国博士学位论文全文数据库 前10条
1 薛斌党;嵌入式隐Markov模型和神经网络人脸识别[D];大连理工大学;2002年
2 叶大鹏;基于2D-HMM的旋转机械故障诊断方法及其应用研究[D];浙江大学;2004年
3 郭浩;基于嵌入式隐Markov模型的指纹分类和匹配研究[D];大连理工大学;2004年
4 王勇献;蛋白质二级结构预测的模型与方法研究[D];国防科学技术大学;2004年
5 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
6 曾剑平;基于模糊集的自适应伪装入侵检测算法及其在ASP服务安全中的应用研究[D];厦门大学;2006年
7 冯长建;HMM动态模式识别理论、方法以及在旋转机械故障诊断中的应用[D];浙江大学;2002年
8 王华;预见式自适应软件体系结构的研究[D];浙江大学;2009年
9 晏春;基因剪接的信号序列分析和相关特征研究[D];国防科学技术大学;2006年
10 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
3 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
4 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
5 杨辉;汉语新词语发现及其词性标注方法研究[D];复旦大学;2008年
6 潘炜;面向层次分类标签的词性标注系统[D];复旦大学;2009年
7 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
8 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
9 艳红;基于统计的蒙古文自动词性标注的研究与实现[D];内蒙古师范大学;2010年
10 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026