收藏本站
《电脑开发与应用》 2001年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

分词及词性标注一致性校对系统的设计与实现

杜永萍  郑家恒  
【摘要】:针对真实语料中分词、词性标注结果前后不一致的现象提出了基于规则库的校对方法与策略 ,设计了一致性校对系统 ,进一步提高分词、词性标注的正确率。
【作者单位】山西大学 山西大学
【基金】:山西省自然科学基金资助 (2 0 0 0 10 32 )
【分类号】:TP391.1

【引证文献】
中国期刊全文数据库 前3条
1 刘江,郑家恒,张虎;中文文本语料库分词一致性检验技术的初探[J];计算机应用研究;2005年09期
2 苗玺;郑家恒;;中文语料库分词不一致的分类处理研究[J];山西大学学报(自然科学版);2006年01期
3 王国伟,严隽薇;基于规则的企业模型一致性检查[J];微型电脑应用;2003年01期
中国重要会议论文全文数据库 前2条
1 卢俊之;;基于机器学习的分词不一致自动识别研究[A];第三届学生计算语言学研讨会论文集[C];2006年
2 程月;季娜;洪鹿平;;基于语料统计的以“不”开头双字分词不一致研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前5条
1 王用源;废“离合词”兴“组合词”[D];天津大学;2004年
2 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
3 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
4 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
5 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
3 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
4 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
5 冯丽萍;;基于统计的中文组织机构名识别[J];福建电脑;2006年01期
6 谢春发;中文信息处理在智能答疑系统中的应用研究[J];福建广播电视大学学报;2005年02期
7 李朝虹,陆建湖;现代汉语自动分析研究现状综述[J];广西教育学院学报;2003年01期
8 黄维金;顾益军;赵勋平;;基于自然语言理解的Web敏感信息监控[J];中国人民公安大学学报(自然科学版);2006年01期
9 邢钧;刘舒;王斌君;;一种基于词与简单路径XML索引系统的设计[J];中国人民公安大学学报(自然科学版);2006年02期
10 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
中国重要会议论文全文数据库 前9条
1 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
3 程月;季娜;洪鹿平;;基于语料统计的以“不”开头双字分词不一致研究[A];第三届学生计算语言学研讨会论文集[C];2006年
4 杜超华;沈威;姚双云;;基于复句语料库的分词系统的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 朱丽丽;郑家恒;;一种基于实例学习的人名识别方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 吐尔根·依不拉音;阿里甫·库尔班;阿不都热依木;;基于词典的现代维吾尔语词性自动标注系统的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 赫琳;;论“X 从小 Y”的词切分——“从小”语义指向计算机识别的再思考[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
9 余军;陈晓鸥;;命名实体识别:One-at-a-time or All-at-once?Word-based or Character-based?[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前9条
1 张蕾;概念结构及其应用[D];西北工业大学;2001年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
6 刘伟;现代汉语代词隐现的动态研究[D];北京语言大学;2005年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 吴思;聚类分析及其在农业物种信息自动提取中的应用[D];湘潭大学;2001年
2 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
3 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
4 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
5 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
6 许林杰;中文文本分词研究[D];山东师范大学;2003年
7 由丽萍;动词与动词搭配自动获取方法研究[D];上海师范大学;2003年
8 岑咏华;科技信息门户网站的技术研究[D];南京理工大学;2003年
9 刘军;基于论点倾向的网络信息内容实时分析研究[D];四川大学;2003年
10 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
【同被引文献】
中国期刊全文数据库 前10条
1 丁丰,董娜,林碧琴,袁保宗;自然语言处理系统中自动分词的研究[J];北方交通大学学报;1999年06期
2 田新华;编辑的语言文字观[J];北京理工大学学报(社会科学版);2003年03期
3 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
4 冯胜利;论汉语“词”的多维性[J];当代语言学;2001年03期
5 曹保平,冯桂华;“离合词”的构成及离合规律[J];广播电视大学学报(哲学社会科学版);2003年04期
6 付国宏,王晓龙;面向真实文本的汉语词法自动分析系统[J];高技术通讯;1999年12期
7 李军,王鑫,常荣清;基于机器学习的兼类词词性标注[J];信息技术;1999年12期
8 晋耀红,苗传江;一个基于语境框架的文本特征提取算法[J];计算机研究与发展;2004年04期
9 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
10 张民,李生,赵铁军;基于评价的汉语词性纯概率标注算法[J];计算机研究与发展;1998年04期
中国重要会议论文全文数据库 前1条
1 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国硕士学位论文全文数据库 前2条
1 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
2 黄立冬;基础教育资源搜索引擎中的中文分词技术研究[D];南京师范大学;2006年
【二级引证文献】
中国期刊全文数据库 前1条
1 石爱兵;;九十年代后离合词研究综述[J];和田师范专科学校学报;2006年06期
中国重要会议论文全文数据库 前3条
1 卢俊之;;基于机器学习的分词不一致自动识别研究[A];第三届学生计算语言学研讨会论文集[C];2006年
2 程月;季娜;洪鹿平;;基于语料统计的以“不”开头双字分词不一致研究[A];第三届学生计算语言学研讨会论文集[C];2006年
3 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国硕士学位论文全文数据库 前1条
1 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026