收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于词聚类特征的统计中文组块分析模型

孙广路  王晓龙  刘秉权  关毅  
【摘要】:提出了一种基于信息熵的层次词聚类算法,并将该算法产生的词簇作为特征应用到中文组块分析模型中.词聚类算法基于信息熵的理论,利用中文组块语料库中的词及其组块标记作为基本信息,采用二元层次聚类的方法形成具有一定句法功能的词簇.在聚类过程中,设计了优化算法节省聚类时间.用词簇特征代替传统的词性特征应用到组块分析模型中,并引入名实体和仿词识别模块,在此基础上构建了基于最大熵马尔科夫模型的中文组块分析系统.实验表明,本文的算法提升了聚类效率,产生的词簇特征有效地改进了中文组块分析系统的性能.

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 许广平;;用信息熵极大推导氢原子基态径向波函数的尝试[J];武汉科技大学学报(自然科学版);1986年04期
2 卢文祥;;工程测试中的信息论基础(一)——工程测试与信息论[J];振动、测试与诊断;1989年02期
3 卢文祥;;工程测试中的信息论基础(二)——信息熵[J];振动、测试与诊断;1989年03期
4 龚宇清,周仕勇;“地震活动信息熵与分数维”研究的软件设计[J];计算机应用研究;1990年06期
5 康承华,康京娟;熵、信息熵和心电图的分维[J];福州大学学报(自然科学版);1992年01期
6 邓光辉,徐功仁;非线性动态系统理论在林业系统中的应用——Ⅱ.用信息熵研究林业系统中生态和经济协调关系[J];华东理工大学学报;1992年06期
7 吴国恩;情报信息熵研究[J];情报理论与实践;1993年01期
8 王德义;信息系统与信息熵[J];情报理论与实践;1993年01期
9 丁晓青,吴佑寿;模式识别统一熵理论[J];电子学报;1993年08期
10 周兆经;;最大熵原理在情报检索中的应用[J];技术与市场;1993年01期
中国重要会议论文全文数据库 前10条
1 黄冬梅;花强;高印芝;;产生模糊决策树的一个新算法[A];模糊集理论与应用——98年中国模糊数学与模糊系统委员会第九届年会论文选集[C];1998年
2 沈萍;郑治真;;瞬态谱理论和信息增益在地震预报中的应用[A];1998年中国地球物理学会第十四届学术年会论文集[C];1998年
3 尹殿云;;信息熵应用于临床医学的研究[A];中国生物医学工程学会医学物理分会第十次学术年会、中华医学会医学工程学分会第一次医疗设备科学管理研讨会论文集[C];1998年
4 苗夺谦;王珏;;知识粗糙性的信息论解释[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
5 张永平;郑南宁;李翠华;;基于小波神经网络的图象增强算法[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
6 欧阳玉飞;陈光发;;一种新的神经网络与HMM混合连接短语识别系统[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 谷可;田宝国;姜璐;;关于熵值与Pi关系的讨论[A];Systems Engineering, Systems Science and Complexity Research--Proceeding of 11th Annual Conference of Systems Engineering Society of China[C];2000年
8 陈虬;刘长虹;雷震宇;;模糊随机有限元法的一些进展——第九届全国结构工程学术会议特邀报告[A];第九届全国结构工程学术会议论文集第Ⅰ卷[C];2000年
9 张玲霞;陈明;杨俊;;基于误差信息熵模型的传感器特性辨识[A];2001年飞行器惯性器件学术交流会论文集[C];2001年
10 甄玲;陈伯川;黄春燕;黄海;王晓萍;;气固流化床压力信号的混沌特性与信息熵分析[A];中国仪器仪表学会第三届青年学术会议论文集(上)[C];2001年
中国博士学位论文全文数据库 前10条
1 刘先省;传感器管理方法研究[D];西北工业大学;2000年
2 王学良;基于成像光谱图像特征的处理方法研究[D];中国科学院长春光学精密机械与物理研究所;2000年
3 李玉榕;信息融合与智能处理的研究[D];浙江大学;2001年
4 王栋;熵及其在水系统中的研究与应用[D];河海大学;2001年
5 郭满才;群体遗传变异的信息学模型研究[D];西北农林科技大学;2002年
6 刘澜;智能运输系统的信息物理-事理(WS)研究[D];西南交通大学;2003年
7 史玉峰;数字信息模式识别理论及其应用[D];山东科技大学;2003年
8 黄元元;基于视觉特征的图像检索技术研究[D];南京理工大学;2003年
9 孙广义;矿井支护系统可靠性理论研究[D];辽宁工程技术大学;2003年
10 张明;基于内容的图象相似性度量技术研究及其在水利中的应用[D];河海大学;2003年
中国硕士学位论文全文数据库 前10条
1 蒋运承;Rough集和Rough关系数据库中熵的研究[D];广西师范大学;2000年
2 蒋国萍;狱政管理辅助决策系统设计与实现技术研究[D];国防科学技术大学;2001年
3 孙国春;对企业进行股份制改造及绩效评价指标的研究[D];东北农业大学;2001年
4 叶鑫;一维Rindler谐振子的广义测不准关系[D];大连理工大学;2001年
5 凌方;基于粗集理论的数据挖掘技术研究[D];南京航空航天大学;2002年
6 胡丹;基于Rough Set的规则提取与粗—模糊神经网络研究[D];四川师范大学;2002年
7 尹海东;农牧结合生态系统物流模型的建立、评价与博弈决策研究[D];东北农业大学;2002年
8 孙晓龙;电压暂降检测与分析系统[D];华北电力大学;2002年
9 于丹;一维谐振子在坐标表象中的表示[D];大连理工大学;2002年
10 孙超利;数据挖掘决策树方法的研究与应用[D];河海大学;2003年
中国重要报纸全文数据库 前8条
1 语言文字应用研究所研究员 冯志伟;汉语拼音是语言信息处理的有效工具[N];光明日报;2000年
2 ;“熵”在中医方证研究中的运用[N];中国中医药报;2004年
3 上海远东证券公司首席金融工程专家 马小佐;宝钢股份及宝钢权证估值分析[N];证券日报;2005年
4 远东证券首席金融工程专家 马小佐;武钢股份及武钢权证估值分析[N];证券日报;2005年
5 李海霞 王阶;基于信息熵的血瘀证症状规范化研究[N];中国中医药报;2006年
6 自治区征地事务中心 滕健;基于熵值法的乌鲁木齐城市土地利用综合效益评价[N];新疆科技报(汉);2007年
7 ;互联网安全 化无序为有序[N];计算机世界;2008年
8 冯卫东;改头换面也能认出你[N];科技日报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978