收藏本站
《北京理工大学学报》 2012年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

BFS-CTC汉语句义结构标注语料库构建方法

罗森林  刘盈盈  冯扬  韩磊  陈功  王倩  
【摘要】:根据现代汉语语义学,构建了一种层次化的句义结构模型.基于该模型构建了汉语句义结构标注语料库(Beijing forest studio-Chinese tagged corpus,BFS-CTC).利用自行开发的标注和管理工具,对模型中各个句义成分及其组合关系进行快速标注,降低培训工作量和标注成本.BFS-CTC涵盖了6种句式类型,约1万句,提供了符合现有规范的词法和句法标注信息与自定义规范的句义结构标注信息,便于词法、句法和句义的对照分析研究,以及语料的综合使用和横向分析.此外,BFS-CTC还具有较强的可扩展性,可在核心标注库基础上扩展生成其它扩展库和标注资源.

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范[J];中文信息学报;2002年05期
2 周强;;汉语基本块描述体系[J];中文信息学报;2007年03期
3 陈立民;汉语的时态和时态成分[J];语言研究;2002年03期
【共引文献】
中国期刊全文数据库 前10条
1 盛林;;《广雅疏证》中的同义观[J];安徽大学学报(哲学社会科学版);2009年03期
2 李先华;;唐诗词语隐含义个案考察及相关问题研究[J];安徽师范大学学报(人文社会科学版);2006年06期
3 张蕾;;武汉市楼盘名称的语义特征[J];安徽文学(下半月);2008年09期
4 黄小莉;;词典编撰的研究现状概述[J];安徽文学(下半月);2008年11期
5 张明友;;“已经”语法意义新探——对外汉语教学中引发的思考与探询[J];安徽文学(下半月);2009年06期
6 程勇,吴玺宏,迟惠生;汉语韵律边界定位与选音算法研究[J];北京大学学报(自然科学版);2004年03期
7 申莉;;表将来的“将”和“要”语法分析[J];北京联合大学学报(人文社会科学版);2007年01期
8 王洁;语言结构规律对新词语仿造的作用试探[J];毕节师范高等专科学校学报(综合版);2000年02期
9 何伟;马瑞芝;;现代汉语时间系统研究综述[J];北京科技大学学报(社会科学版);2011年01期
10 王轶高;;汉语与“香”有关的同义词词族[J];四川职业技术学院学报;2008年03期
中国重要会议论文全文数据库 前10条
1 林达真;李绍滋;;基于模式分类的汉语时态确定方法研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 俞士汶;朱学锋;段慧明;张化瑞;;以词义为主轴的综合型语言知识库[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 希夏姆;;关于汉语作为第二语言教学中的翻译课问题[A];第七届国际汉语教学讨论会论文选[C];2002年
4 肖奚强;;“正(在)”、“在”与“着”功能比较研究[A];第七届国际汉语教学讨论会论文选[C];2002年
5 常宝宝;肖华云;;面向语言学家和词典编纂专家的汉英双语语料库检索系统[A];2004年辞书与数字化研讨会论文集[C];2004年
6 胡凤国;傅爱平;;汉语粘合式名词短语语义结构信息数据库[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 颜伟;王洁;尚英;宋柔;;《中国大百科全书》人物传记知识提取加工规范[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 黄昌宁;林娟;孙承杰;;何谓金本位[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 俞士汶;段慧明;朱学锋;;词语兼类暨动词向名词漂移现象的计量分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 郭慧志;刘华;谢学敏;张普;;《人民日报》标注语料的初步统计分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 曲丽玮;元刊杂剧复字词汇研究[D];南开大学;2010年
2 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
3 吴云霞;万荣方言语法研究[D];厦门大学;2002年
4 徐默凡;现代汉语工具范畴的认知研究[D];华东师范大学;2003年
5 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
6 潘文;现代汉语存现句研究[D];复旦大学;2003年
7 尚新;语法体的内部对立与中立化[D];华东师范大学;2004年
8 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
9 解海江;汉语编码度研究[D];厦门大学;2004年
10 宋永圭;现代汉语情态动词“能”的否定研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
2 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
3 周睿;动宾式惯用语研究[D];湘潭大学;2010年
4 郭瞳康;基于词典的中文分词技术研究[D];哈尔滨理工大学;2010年
5 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
6 徐奇;江西境内赣方言动词完成体考察[D];南昌大学;2010年
7 李平;苍溪方言体貌范畴研究[D];浙江财经学院;2010年
8 范敏敏;企业经营范围字段自动分类方法研究[D];哈尔滨工业大学;2010年
9 邓高;中国語の「了着过」の文法機能及び対応する日本語のテンス·アスペクト[D];河北大学;2010年
10 施栋琴;进行概念的表达和情状类型——英汉对比及其在翻译中的应用[D];上海海运学院;2000年
【二级参考文献】
中国期刊全文数据库 前6条
1 孔令达;;关于动态助词“过_1”和“过_2”[J];安徽师大学报(哲学社会科学版);1986年04期
2 张昱琪,周强;汉语基本短语的自动识别[J];中文信息学报;2002年06期
3 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
4 董振东;语义关系的表达和知识系统的建造[J];语言文字应用;1998年03期
5 石毓智;;论现代汉语的“体”范畴[J];中国社会科学;1992年06期
6 ;商务印书馆今年计划出版的哲学译著[J];哲学研究;1959年02期
中国重要会议论文全文数据库 前3条
1 邓守信;;汉语动词的时间结构[A];第一届国际汉语教学讨论会论文选[C];1985年
2 郭春贵;;关于“了_3”的问题[A];第一届国际汉语教学讨论会论文选[C];1985年
3 马盛静恒;;汉语“了、过、是…的、着、在、呢” 教材教法的构想[A];第一届国际汉语教学讨论会论文选[C];1985年
【相似文献】
中国期刊全文数据库 前10条
1 虎晓红;钱旭;王晓磊;;图像语义标注中的叙词查询方法[J];计算机应用研究;2011年08期
2 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期
3 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期
4 陈叶旺;李海波;余金山;陈维斌;;一种基于稀疏编码的语义标注方法[J];计算机科学;2011年09期
5 文俊浩;涂丽云;江卓;何盼;;基于功能语义标注的Web服务发现方法[J];计算机应用研究;2011年07期
6 魏墨济;于涛;;基于领域本体的专业文档语义标注方法[J];计算机应用;2011年08期
7 朱嘉贤;白伟华;李吉桂;;Web资源的多粒度语义标注及其应用技术研究[J];计算机科学;2011年08期
8 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
9 段丽艳;刘波;庞雄文;;一种面向企业的语义Mashup平台[J];广东第二师范学院学报;2011年03期
10 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
中国重要会议论文全文数据库 前10条
1 陈波;姬东鸿;孙程;吕晨;;基于特征结构的汉语主谓谓语句语义标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
3 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
5 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
7 袁柳;李战怀;陈世亮;;OntoWord:一种新的Web页面语义标注方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 曾诚;李兵;何克清;;KMP算法在Web服务语义标注中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
5 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
6 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
7 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
8 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
9 本报记者 关逸民;中文速录成为自主核心技术产业[N];中国信息报;2006年
10 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
中国博士学位论文全文数据库 前10条
1 刘海学;基于语义标注的元数据自动构建及其相关技术研究[D];华东师范大学;2010年
2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
3 虎晓红;用于图像检索的语义标注技术的研究[D];中国矿业大学(北京);2010年
4 熊华;视频内容结构化技术的研究与实现[D];中国人民解放军国防科学技术大学;2001年
5 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
6 李景;领域本体的构建方法与应用研究[D];中国农业科学院;2009年
7 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
8 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
9 陈叶旺;国家农业本休协同建构与语义检索若干技术研究[D];复旦大学;2009年
10 李东民;物流服务匹配与选择研究[D];山东科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年
2 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
3 刘斌;基于CPN网络的Deep Web集成系统中结果模式语义标注方法[D];东北大学;2008年
4 黄文;三维模型语义标注系统的设计与实现[D];西北大学;2011年
5 常建峰;基于模糊支持向量机的图像语义标注[D];太原理工大学;2011年
6 徐利谋;基于语义的Web服务发现研究[D];湖南工业大学;2008年
7 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
8 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
9 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
10 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026