收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于CRF的中文组块分析

徐中一  胡谦  刘磊  
【摘要】:提出一种基于条件随机域模型的方法用于中文文本组块分析.该方法将中文组块分析转化为对每个词语赋予一个组块标注符号,再根据条件随机域对标注好的训练语料建立模型,从而预测测试语料中每个词语的组块标注符号.使用北京大学中文树库的测试结果为F1=85.5%,高于隐马尔可夫模型和最大熵马尔可夫模型.实验结果表明,条件随机域在中文组块识别方面有效,并避免了严格的独立性假设和数据归纳偏置问题.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谭魏璇;孔芳;倪吉;周国栋;;基于混合统计模型的中文基本名词短语识别[J];计算机应用与软件;2011年08期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前9条
1 庞文斌;张国煊;曹恬;;基于规则和统计的汉语浅层句法分析的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
3 王浩畅;赵铁军;刘延力;于浩;;生物医学文本中命名实体识别的智能化方法[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
4 王浩畅;赵铁军;李艳;;生物医学命名实体识别的特征选取与评价[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 史树敏;王志强;周浪;冯冲;黄河燕;;基于条件随机域的中文命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
6 张孝飞;黄河燕;陈肇雄;;一种面向机器翻译的双语组块识别方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 王昌晶;薛锦云;;PAR平台中结构化需求语言研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
8 张运良;张全;;概念优先组合判断研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 陈毅东;史晓东;周昌乐;;厦门大学第四届全国机器翻译研讨会评测系统描述[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
中国博士学位论文全文数据库 前3条
1 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
2 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
3 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 罗雪兵;汉语组块识别的研究[D];大连理工大学;2007年
2 何赛克;语义角色标注中的关键技术研究[D];北京邮电大学;2010年
3 于静;汉语句子的组块识别研究[D];大连理工大学;2008年
4 唐琴;受限领域中文情感问答系统研究[D];大连理工大学;2008年
5 潘越群;时间表达式识别与归一化研究[D];哈尔滨工业大学;2008年
6 徐琳宏;基于语义资源的文本情感计算[D];大连理工大学;2007年
7 马龙;基于条件随机域模型的中文地名识别的研究[D];大连理工大学;2009年
8 王琦;词典和机器学习相结合的生物命名实体识别[D];大连理工大学;2009年
9 肖清梅;汉语组块识别的研究与应用[D];大连理工大学;2009年
10 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978