收藏本站
《计算机应用》 2015年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于语义扩展的短问题分类

冶忠林  杨燕  贾真  尹红风  
【摘要】:问题分类是问答系统任务之一。特别是语音交互方式中,用户的提问较短,具有口语化特征,利用传统文本分类方法对问题进行分类的效果不佳。为此提出一种基于语义扩展的短问题分类方法,该方法使用搜索引擎对问题进行知识扩展;然后,使用主题模型进行特征词选择;最后,利用词语相似度计算获取问题的类别。实验结果表明,所提方法在1 365条真实问题集上平均F-measure值达到0.713,其值高于支持向量机(SVM)、K近邻(KNN)算法和最大熵方法。因此,该方法在问答系统中可以帮助系统提升问题分类的准确率。

【共引文献】
中国期刊全文数据库 前10条
1 张燕;宋锦斌;;卡通动画数字媒体资源管理系统[J];长沙医学院学报;2010年02期
2 郭涛;曲宝胜;郭勇;;自然语言处理中的模型[J];电脑学习;2011年02期
3 曹立勇;郑诚;;基于知网的语义相似度的改进算法[J];电子技术;2010年05期
4 李剑;李金厚;;一种基于知网的概念相似度计算方法[J];工业控制计算机;2011年04期
5 罗灏;徐小良;吕跃华;;科技项目申请书关键词提取方法[J];电子科技;2013年07期
6 黄莹;陈笑蓉;;基于隐特征提取和CRF模型的中文词义消歧[J];贵州大学学报(自然科学版);2013年06期
7 田芳;;基于词语情感倾向的问句相似度计算[J];安庆师范学院学报(自然科学版);2014年02期
8 袁烨城;刘海江;裴韬;高锡章;;基于语义知识的空间关系识别研究[J];地球信息科学学报;2014年05期
9 胡青;;类XPath语义目录机制研究[J];湖北第二师范学院学报;2011年02期
10 裘江南;罗志成;王延章;;基于中文语义词典的语义相关度方法比较研究[J];情报理论与实践;2008年05期
中国重要会议论文全文数据库 前7条
1 邓辉;林柏钢;;一种基于《知网》的敏感信息预测技术[A];第十届中国科协年会论文集(三)[C];2008年
2 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
3 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
4 林颖;史晓东;郭锋;林达真;;一个改进的汉语Chart句法分析模型[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 张惠春;由丽萍;谷波;刘开瑛;;面向框架语义分析的汉语句法分析模型[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 卢俊之;陈小荷;曲维光;王东波;陈锋;丁德鑫;;基于语法功能匹配的汉语句法分析算法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 冯新元;魏建国;路文焕;党建武;;引入领域知识的基于《知网》词语语义相似度计算[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
中国硕士学位论文全文数据库 前10条
1 杨朝玉;基于知网的受限域问答系统原型的设计与实现[D];华南理工大学;2010年
2 胡青;语义目录的实现机制研究[D];武汉科技大学;2010年
3 王慧;最大熵模型的语义句法分析在问答系统中的应用研究[D];大连交通大学;2010年
4 吴波;改进的编辑距离算法的研究及其在电子政务中的应用[D];电子科技大学;2011年
5 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
6 李剑;基于分块的句子语义相似度研究[D];安徽工业大学;2011年
7 刘青磊;汉语词语及句子相似度算法研究与应用[D];电子科技大学;2011年
8 姜孟晋;面向互联网的多元信息获取技术研究[D];复旦大学;2011年
9 郑小波;基于语义的主题搜索引擎研究[D];安徽大学;2011年
10 张振幸;基于知网的模块化的中文句子相似度计算研究[D];安徽工业大学;2010年
【二级参考文献】
中国期刊全文数据库 前2条
1 郭充;张仰森;;基于《知网》义原搭配的中文文本语义级自动查错研究[J];计算机工程与设计;2010年17期
2 张云涛,龚玲,王永成;An improved TF-IDF approach for text classification[J];Journal of Zhejiang University Science A(Science in Engineering);2005年01期
中国重要会议论文全文数据库 前1条
1 杨沐昀;赵铁军;于浩;;自底向上的汉语句法标注体系设计与实践[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 風起;;不一定設領導指導类[J];档案工作;1956年05期
2 文勖;张宇;刘挺;马金山;;基于句法结构分析的中文问题分类[J];中文信息学报;2006年02期
3 张亮;陈肇雄;黄河燕;;问题分类的计算模型研究[J];计算机科学;2006年04期
4 李茹;宋小香;王文晶;;基于汉语框架网的中文问题分类[J];计算机工程与应用;2009年31期
5 田卫东;高艳影;祖永亮;;基于自学习规则和改进贝叶斯结合的问题分类[J];计算机应用研究;2010年08期
6 张巍;陈俊杰;;信息熵方法及在中文问题分类中的应用[J];计算机工程与应用;2013年10期
7 ;试着用新思路将问题分类[J];管理工程师;2001年03期
8 吕德新;张桂平;蔡东风;余超;;基于语义信息的问题分类[J];沈阳航空工业学院学报;2006年03期
9 张志昌;张宇;刘挺;李生;;基于线索词识别和训练集扩展的中文问题分类[J];高技术通讯;2009年02期
10 邱锡鹏;缪有栋;黄萱菁;;基于主动学习的中文问题分类数据集构建[J];哈尔滨工业大学学报;2012年05期
中国重要会议论文全文数据库 前7条
1 李鑫;杜永萍;黄萱菁;吴立德;;基于句法信息和语义信息的问题分类[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 于娟;武港山;;面向政府公文领域的中文问题分类[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
3 张宇;刘挺;文勖;;基于改进贝叶斯模型的问题分类[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 缪有栋;邱锡鹏;黄萱菁;;基于主动学习的中文问题类别标注研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 孙景广;蔡东风;吕德新;董燕举;;基于知网的中文问题自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
6 萧蕴诗;严隽薇;刘云;吴启迪;;OA环境下决策支持系统的问题分类及处理方法[A];1995中国控制与决策学术年会论文集[C];1995年
7 ;第3章 水利水电工程泥沙问题分类和泥沙设计方案拟定[A];水利水电工程泥沙设计[C];2010年
中国重要报纸全文数据库 前2条
1 记者  王小平;中国人寿强化内控合规执行力度[N];金融时报;2006年
2 张晓亮 桑明 马玉玲;敦煌市落实整改记好“三本账”[N];甘肃经济日报;2009年
中国博士学位论文全文数据库 前1条
1 张志昌;开放域阅读理解关键技术研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前9条
1 潘志安;融入本体的问题特征模型在中文问题分类中的研究[D];太原理工大学;2010年
2 高超;中文问题分类中特征选择研究[D];安徽工业大学;2011年
3 文勖;中文问答系统中问题分类及答案候选句抽取的研究[D];哈尔滨工业大学;2006年
4 康鑫;汉日问题分类研究[D];北京邮电大学;2009年
5 尹坤;基于语义信息的问题分类研究[D];西南交通大学;2014年
6 陈海光;HNC理论和随机模糊在问答系统中的应用研究[D];江苏大学;2009年
7 谢正文;中文问答系统关键技术研究[D];宁波大学;2012年
8 刘桂平;基于词义及语义分析的问答技术研究[D];哈尔滨工业大学;2008年
9 徐振;面向问答社区的问题类型敏感的答案摘要算法研究[D];哈尔滨工业大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026