期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《软件学报》 2000年02期
加入收藏 获取最新

汉语最长名词短语的自动识别

周强  孙茂松  黄昌宁  
【摘要】:通过对包含 5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析 ,提出了两种有效的汉语最长名词短语自动识别算法 :基于边界分布概率的识别算法和基于内部结构组合的识别算法 .实验结果显示 ,后者的识别正确率和召回率分别达到了 85.4 %和 82 .3% ,取得了较好的自动识别效果 .关键词 最长名词短语 ,边界识别 ,句法分析 .
【作者单位】智能技术与系统国家重点实验室!北京100084 清华大学计算机科学与技术系!北京100084
【关键词】最长名词短语 边界识别 句法分析
【基金】:国家自然科学基金! (No.6 970 5 0 0 5 ) 中国博士后科学基金! (No.970 0 5 )资助
【分类号】:TP391.1
【DOI】:CNKI:SUN:RJXB.0.2000-02-007
【正文快照】:
在自然语言句子的理解过程中 ,能否准确地识别其中的名词短语 (np)起着很重要的作用 .按照认知科学的观点 ,人类必须首先识别、学习和理解文本中的实体 (entity)或者概念 (具体的或抽象的 ) ,才能很好地理解自然语言文本 ,而这些实体和概念大都是由文本句子中的名词短语所描
全文下载: CAJ格式 (推荐) PDF格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【引证文献】
中国期刊全文数据库 前10条
1 李素建,刘群,白硕;统计和规则相结合的汉语组块分析[J];计算机研究与发展;2002年04期
2 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
3 周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期
4 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
5 牛正雨,柴佩琪;基于边界点词性特征统计的韵律短语切分[J];中文信息学报;2001年05期
6 刘冬明,赵军,杨尔弘;汉英双语语料库中名词短语的自动对应[J];中文信息学报;2003年05期
7 姜韶华;党延忠;;无词典中英文混合术语抽取及算法研究[J];情报学报;2006年03期
8 姜韶华;党延忠;宣照国;;无词典抽词的RMMFS和BMMFS方法及其比较研究[J];情报学报;2006年04期
9 詹红斌,肖人彬;面向智能设计的仿自然汉语程序设计语言[J];小型微型计算机系统;2002年06期
10 冯冲;陈肇雄;黄河燕;张亮;王江伟;;基于条件随机域的复杂最长名词短语识别[J];小型微型计算机系统;2006年06期
中国重要会议论文全文数据库 前7条
1 钱小飞;陈小荷;;含“的”字偏正结构的最长名词短语的自动识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 马艳军;刘颖;;汉英准等价名词短语[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 李素建;刘群;;汉语组块的定义和获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 周强;;汉语部分分析研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 彭国珍;邹纲;;基于汉英双语语料库述宾短语的自动抽取[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 Yanjun MA Ying LIU Lab of Computational Linguistics, Department of Chinese Language and Literature, Tsinghua University, Beijing, 100084;Chinese-English Quasi-equivalent Noun Phrase:Definition and Automatic Identification[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
中国博士学位论文全文数据库 前7条
1 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
4 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
5 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
6 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
7 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
2 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
3 耿春霞;基于机械设计领域的汉语句法分析研究[D];西安电子科技大学;2004年
4 刘冬明;汉英双语平行语料库中对齐方法的研究[D];山西大学;2004年
5 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
6 庄明;装备发展战略研究信息化平台中汉语文本信息提取技术的研究[D];国防科学技术大学;2003年
7 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
8 张惠春;面向框架语义的汉语短语自动识别研究[D];山西大学;2006年
9 于浚涛;基于最大熵的汉语介词短语自动识别[D];大连理工大学;2006年
10 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 梁颖红,赵铁军,姚建民,于浩,徐冰;基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略[J];计算机工程与应用;2004年35期
2 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期
3 赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期
4 曹倩,丁艳,王超,潘金贵;汉语自动分词研究及其在信息检索中的应用[J];计算机应用研究;2004年05期
5 张锋,许云,侯艳,樊孝忠;基于互信息的中文术语抽取系统[J];计算机应用研究;2005年05期
6 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
7 郭永辉;杨红卫;马芳;王炳锡;;基于粗糙集的基本名词短语识别[J];中文信息学报;2006年03期
8 李峰;李芳;;中文词语语义相似度计算——基于《知网》2000[J];中文信息学报;2007年03期
9 陆勇;侯汉清;;基于模式匹配的汉语同义词自动识别[J];情报学报;2006年06期
10 杜小勇;李曼;王珊;;本体学习研究综述[J];软件学报;2006年09期
中国重要会议论文全文数据库 前10条
1 史中琦;张普;;基于DCC动态流通语料库的流行语类型分析[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
2 ;第二届全国信息检索与内容安全学术会议(NCIRCS-2005)组织情况[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 张昱琪;周强;;大规模真实文本中汉语动词语法搭配模板的自动识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 李素建;刘群;;汉语组块的定义和获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 徐时仪;;数据库建设与断代词典编纂[A];中国辞书论集2000[C];2000年
7 隋岩;张普;;基于动态流通语料库的“动态词典”编纂[A];中国辞书论集2000[C];2000年
8 郑家恒;杜永萍;宋礼鹏;;农业病虫害词汇获取方法初探[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 方芳;李斌;;基于语料库的数量名短语识别[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
2 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
3 邓云华;汉语联合短语的类型和共性研究[D];湖南师范大学;2004年
4 张晓刚;面向软件过程改进的知识管理技术研究[D];中国科学院研究生院(软件研究所);2004年
5 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
6 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
7 李丹;科学研究活动中的知识管理研究[D];武汉大学;2005年
8 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
9 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
10 李芸;信息科学和信息技术术语概念体系研究[D];北京语言文化大学;2003年
中国硕士学位论文全文数据库 前4条
1 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
2 史中琦;基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[D];北京语言大学;2005年
3 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
4 由丽萍;动词与动词搭配自动获取方法研究[D];上海师范大学;2003年
【二级引证文献】
中国期刊全文数据库 前10条
1 冯冲;陈肇雄;黄河燕;王江伟;;最大熵模型的树-栅格最优N解码算法[J];计算机科学;2005年10期
2 刘华;;一种快速获取领域新词语的新方法[J];中文信息学报;2006年05期
3 徐延勇,周献中,井祥鹤,郭忠伟;基于最大熵模型的汉语句子分析[J];电子学报;2003年11期
4 张仰森;曹元大;俞士汶;;最大熵方法中特征选择算法的改进与纠错排歧[J];北京理工大学学报;2006年01期
5 刘贵全;曾宇斌;;基于最大熵模型的汉语依存分析[J];计算机工程;2006年11期
6 张晓艳;王挺;陈火旺;;基于混合统计模型的汉语命名实体识别方法[J];计算机工程与科学;2006年06期
7 李剑锋,胡国平,王仁华;基于最大熵模型的韵律短语边界预测[J];中文信息学报;2004年05期
8 干俊伟,黄德根;汉语介词短语的自动识别[J];中文信息学报;2005年04期
9 王建会,王雷,胡运发;词语间依存关系的定量识别[J];中文信息学报;2005年04期
10 黄德根;王莹莹;;基于SVM的组块识别及其错误驱动学习方法[J];中文信息学报;2006年06期
中国重要会议论文全文数据库 前10条
1 Yu Zhengtao~(1,2) Fan Xiaozhong~1 Song Lizhe~1 Guo Jianyi~2 1 Department of Computer Science & Engineering,Beijing Institute of Technology,Beijing,100081,China 2 The School of Information Engineering and Automation & Kunming University of Science and Technology,Kunming,650051,China;Chinese Question Classification Combining Syntactic and Semantic Feature[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 6)[C];2005年
2 何亮;戴新宇;周俊生;陈家骏;;一种结合BaseNP识别的汉语概率句法分析改进模型[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 罗雪兵;黄德根;周惠巍;李丽双;;基于组合方法的组块识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 张孝飞;黄河燕;陈肇雄;;一种面向机器翻译的双语组块识别方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 钱小飞;陈小荷;;含“的”字偏正结构的最长名词短语的自动识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 庞文斌;张国煊;曹恬;;基于规则和统计的汉语浅层句法分析的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 李军辉;朱巧明;李培峰;;一个基于最大熵模型的文本分类方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 刘悦;许洪波;程学旗;;互联网挖掘和搜索的研究进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 张运良;张全;;概念优先组合判断研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
10 张仰森;曹元大;;最大熵建模方法中一种改进的特征选择算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
2 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
3 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
4 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
5 胡春玲;人机互动的多策略机器翻译系统中跟踪记忆机制的研究[D];中国科学院研究生院(计算技术研究所);2000年
6 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
7 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
8 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
9 韩秀娟;基于动态流通语料库的通用词语用字研究及字词语关系考察[D];北京语言大学;2007年
10 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
中国硕士学位论文全文数据库 前10条
1 张真;基于语义相似度的中文文本分类系统的研究与实现[D];大连海事大学;2007年
2 刘宝艳;面向生物医学领域的问答系统的研究与实现[D];大连理工大学;2007年
3 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
4 彭其伟;基于统计方法的中文文本情感倾向分类研究[D];山西大学;2007年
5 罗雪兵;汉语组块识别的研究[D];大连理工大学;2007年
6 秦立东;基于俄汉熟语语料库的俄语熟语模式化及自动识别[D];黑龙江大学;2007年
7 蔡凤真;汉语通用数据库接口的研究与实现[D];中国石油大学;2007年
8 曹淑英;个性化自动文摘的研究与实现[D];中国石油大学;2007年
9 孙勇;突发事件应急预案形式化描述方法研究[D];大连理工大学;2007年
10 程亮;自然语言机务信息中语义句式的研究[D];南京航空航天大学;2006年
【相似文献】
中国期刊全文数据库 前5条
1 周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期
2 周强,孙茂松,黄昌宁;汉语最长名词短语的自动识别[J];软件学报;2000年02期
3 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
4 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
5 冯冲;陈肇雄;黄河燕;张亮;王江伟;;基于条件随机域的复杂最长名词短语识别[J];小型微型计算机系统;2006年06期
中国重要会议论文全文数据库 前3条
1 张昱琪;周强;;大规模真实文本中汉语动词语法搭配模板的自动识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 马艳军;刘颖;;汉英准等价名词短语[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 ;Chinese-English Quasi-equivalent Noun Phrase:Definition and Automatic Identification[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
中国硕士学位论文全文数据库 前1条
1 钱小飞;含“的”最长名词短语的自动识别[D];南京师范大学;2007年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭