收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于层叠CRF的古文断句与句读标记方法

张合  王晓东  杨建宇  周卫东  
【摘要】:针对利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题,设计了一种六字位标记集,提出了一种基于层叠式CRF模型的古文断句与句读标记方法。基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察序列和低层的句子边界信息进行句读标记。实验在5M混合古文语料上分别进行了封闭测试和开放测试,封闭测试断句与句读标注的F值分别达到96.48%和91.35%,开放测试断句与句读标注的F值分别达到71.42%和67.67%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 方莹;;C-CRF模型在农作物名识别中的应用[J];广东农业科学;2011年06期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前8条
1 彭洪保;李茹;段建勇;;基于汉语框架网的问句语义角色自动标注研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 刘开瑛;陈雪艳;李济洪;;汉语框架元素自动标注实验报告[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 刘开瑛;;汉语框架语义网(CFN)构建现状[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 石民;陈小荷;于丽丽;李斌;;基于CRF的古汉语分词标注一体化研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 林河水;程伟;吴健;;垂直显示标记语言VHTML的设计与实现[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
6 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 赵伟;王美艳;刘闯;;基于古汉语语料数据库词的划分方法研究与探索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 麦世基;;《华升汉字编码》——一种数字化的汉字编码系统[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978