收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于概率统计技术和规则方法的新词发现

贾自艳  史忠植  
【摘要】:新词/短语的识别是自然语言处理、信息检索和机器翻译等领域的一项基础研究。该文分析了已有短语抽取技术,并结合汉语特点,提出了基于概率统计技术和规则方法相结合的概念抽取方法。该方法包括高效的“二元语法”统计模型、统计算法、统计选词策略、丰富的规则知识和规则过滤算法。实验证明该方法适用于从大规模语料库中自动高效地发现新词/短语。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 曾用强;基于语料库的练习生成系统[J];外语电化教学;2002年04期
2 康伟;;大规模单语语料的索引及检索[J];鞍山科技大学学报;2007年01期
3 刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期
4 周艳;艾斯卡尔;;基于可变长音素序列拼接单元的维吾尔语语音合成技术研究[J];四川理工学院学报(自然科学版);2007年02期
5 张普;关于大规模真实文本语料库的几点理论思考[J];语言文字应用;1999年01期
6 王爽;熊德兰;王晓霞;;基于实例的古文机器翻译设计与实现[J];许昌学院学报;2009年05期
7 曹英;徐卫;;基于网页的语料库自动生成[J];电脑知识与技术;2010年23期
8 吴迪;浅谈开发《CONULEXID英汉语言资料库》的意义[J];科技与出版;1998年04期
9 何儒云,汤艳莉;智能化信息检索研究[J];图书馆;2003年03期
10 陆剑江;张霞;;基于Web语料库的知识发现设计与研究[J];计算机应用与软件;2006年07期
11 张亮;王树梅;黄河燕;张孝飞;;面向中文问答系统的问句句法分析[J];山东大学学报(理学版);2006年03期
12 邱悦;;跨语言信息检索研究[J];图书情报工作;2006年10期
13 郝天侠;;跨语言信息检索技术与应用研究[J];情报杂志;2007年12期
14 王清;殷业;;基于Globish的旅游用英汉翻译系统的研究[J];企业科技与发展;2008年12期
15 高璐;;藏语天气预报语音合成系统的初步研究[J];电脑与电信;2009年01期
16 翟东升;王立轻;;燃料电池英语语料库的建库及其应用研究[J];情报杂志;2010年05期
17 袁煜;;正则表达式在外语教学及研究中的应用[J];软件导刊;2011年01期
18 何婷婷;谢芳;;利用BP神经网络的中文词义消歧模型[J];华中师范大学学报(自然科学版);2005年04期
19 李雪涛;文茂平;杨鉴;;基于Web网页语料构建动态语言模型[J];信息技术;2006年08期
20 任成梅;李春英;;汉英跨语言信息检索探讨[J];图书馆理论与实践;2006年06期
中国重要会议论文全文数据库 前10条
1 梁红梅;尹晓霞;李宇庄;;有关语料库驱动下的外语在线自主学习的工作底稿[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
2 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
3 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
4 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
6 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
7 郭启新;;论语料库与英汉词典配例[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
8 蔡莲红;蔡锐;吴志勇;陶建华;;语音合成语料库的设计与声学特征分析[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年
10 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
2 夏云;基于语料库的英汉翻译小说常规化研究:历时的视角[D];山东大学;2010年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 曲英梅;基于语料库的英汉动名化对比研究[D];东北师范大学;2009年
5 王青;基于语料库的《尤利西斯》汉译本译者风格研究[D];山东大学;2010年
6 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
7 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年
8 王丽;基于语料库的中国学习者英语口语中语用标记语研究[D];上海交通大学;2008年
9 徐欣;基于语料库的英汉小说语篇中话语标记功能研究[D];山东大学;2011年
10 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 徐琰;基于语料库的ONLY研究[D];大连海事大学;2003年
3 杨丽萍;基于语料库的英语专业大学生议论文限时写作中的四字词块研究[D];江西师范大学;2010年
4 李淼;用先进的语料库工具推进英语教学[D];首都师范大学;2004年
5 李春青;[D];电子科技大学;2004年
6 王蓉;新闻英语的批评性语篇分析[D];上海师范大学;2010年
7 刘鼎甲;连接成分的显化:基于语料库的中英文翻译文本对比[D];燕山大学;2010年
8 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年
9 谢晓燕;基于眼动技术和动态流通语料库(DCC)的汉语阅读注视块研究[D];北京语言大学;2005年
10 黄洁;基于语料库的商务英语词汇特点的研究[D];大连海事大学;2010年
中国重要报纸全文数据库 前10条
1 记者 王坤宁;商务方正合作开发辞书语料库及编纂系统[N];中国新闻出版报;2002年
2 本报记者 周建华;数字战略打造核心竞争力[N];中国图书商报;2001年
3 卢伟;文学语言的语料库研究方法[N];文艺报;2004年
4 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
5 陈丽萍;从多义短语入手讲授短语的结构类型和层次分析[N];语言文字周报;2010年
6 陶三平 袁志奇;青海总队四支队励志短语激活政治教育课堂[N];人民武警;2008年
7 dream;短信存储我用短语U盘[N];中国电脑教育报;2004年
8 记者 曹秀娟;省社科院两项目获得国家社会科学基金[N];山西日报;2010年
9 王义豹;谈《重游缅湖》中一个短语的翻译[N];中华读书报;2007年
10 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978