汉语最长名词短语的自动识别
【摘要】:通过对包含 5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析 ,提出了两种有效的汉语最长名词短语自动识别算法 :基于边界分布概率的识别算法和基于内部结构组合的识别算法 .实验结果显示 ,后者的识别正确率和召回率分别达到了 85.4 %和 82 .3% ,取得了较好的自动识别效果 .关键词 最长名词短语 ,边界识别 ,句法分析 .
|
|
|
|
| 1 |
李素建,刘群,白硕;统计和规则相结合的汉语组块分析[J];计算机研究与发展;2002年04期 |
| 2 |
周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期 |
| 3 |
周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期 |
| 4 |
李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期 |
| 5 |
牛正雨,柴佩琪;基于边界点词性特征统计的韵律短语切分[J];中文信息学报;2001年05期 |
| 6 |
刘冬明,赵军,杨尔弘;汉英双语语料库中名词短语的自动对应[J];中文信息学报;2003年05期 |
| 7 |
姜韶华;党延忠;;无词典中英文混合术语抽取及算法研究[J];情报学报;2006年03期 |
| 8 |
姜韶华;党延忠;宣照国;;无词典抽词的RMMFS和BMMFS方法及其比较研究[J];情报学报;2006年04期 |
| 9 |
詹红斌,肖人彬;面向智能设计的仿自然汉语程序设计语言[J];小型微型计算机系统;2002年06期 |
| 10 |
冯冲;陈肇雄;黄河燕;张亮;王江伟;;基于条件随机域的复杂最长名词短语识别[J];小型微型计算机系统;2006年06期 |
|
|
|
|
|
| 1 |
梁颖红,赵铁军,姚建民,于浩,徐冰;基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略[J];计算机工程与应用;2004年35期 |
| 2 |
夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期 |
| 3 |
赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期 |
| 4 |
曹倩,丁艳,王超,潘金贵;汉语自动分词研究及其在信息检索中的应用[J];计算机应用研究;2004年05期 |
| 5 |
张锋,许云,侯艳,樊孝忠;基于互信息的中文术语抽取系统[J];计算机应用研究;2005年05期 |
| 6 |
张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期 |
| 7 |
郭永辉;杨红卫;马芳;王炳锡;;基于粗糙集的基本名词短语识别[J];中文信息学报;2006年03期 |
| 8 |
李峰;李芳;;中文词语语义相似度计算——基于《知网》2000[J];中文信息学报;2007年03期 |
| 9 |
陆勇;侯汉清;;基于模式匹配的汉语同义词自动识别[J];情报学报;2006年06期 |
| 10 |
杜小勇;李曼;王珊;;本体学习研究综述[J];软件学报;2006年09期 |
|
|
|
|
|
| 1 |
Yu Zhengtao~(1,2) Fan Xiaozhong~1 Song Lizhe~1 Guo Jianyi~2 1 Department of Computer Science & Engineering,Beijing Institute of Technology,Beijing,100081,China 2 The School of Information Engineering and Automation & Kunming University of Science and Technology,Kunming,650051,China;Chinese Question Classification Combining Syntactic and Semantic Feature[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 6)[C];2005年 |
| 2 |
何亮;戴新宇;周俊生;陈家骏;;一种结合BaseNP识别的汉语概率句法分析改进模型[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年 |
| 3 |
罗雪兵;黄德根;周惠巍;李丽双;;基于组合方法的组块识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年 |
| 4 |
张孝飞;黄河燕;陈肇雄;;一种面向机器翻译的双语组块识别方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年 |
| 5 |
钱小飞;陈小荷;;含“的”字偏正结构的最长名词短语的自动识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年 |
| 6 |
庞文斌;张国煊;曹恬;;基于规则和统计的汉语浅层句法分析的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年 |
| 7 |
李军辉;朱巧明;李培峰;;一个基于最大熵模型的文本分类方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年 |
| 8 |
刘悦;许洪波;程学旗;;互联网挖掘和搜索的研究进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年 |
| 9 |
张运良;张全;;概念优先组合判断研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年 |
| 10 |
张仰森;曹元大;;最大熵建模方法中一种改进的特征选择算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年 |
|