收藏本站
《吉林大学学报(理学版)》 2010年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种无监督文本特征计算模型

王小芳  王瑞芳  张树功  
【摘要】:提出一种基于语义显量子勾连模型和潜量子共现模型的无监督特征提取方法,解决了当前文本聚类不支持增量式和分布式计算的问题,为后续互联网环境下海量文本聚类、单文本摘要以及多文本摘要的发展奠定了基础.实验结果表明,该模型无需领域知识库的支持,在移走约96%的冗余信息后仍能保持较好的聚类效果.

【共引文献】
中国期刊全文数据库 前10条
1 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
2 李玉鑑;操卫平;周兰珍;;结构化向量空间模型及其在Web信息检索中的应用[J];北京工业大学学报;2008年04期
3 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
4 屈赟;杨捧;张文静;;基于信息粒度的主题相似性信息检索[J];河北农业大学学报;2011年01期
5 吴云芳;;词义消歧研究:资源、方法与评测[J];当代语言学;2009年02期
6 朱颢东;李红婵;钟勇;;新颖的无监督特征选择方法[J];电子科技大学学报;2010年03期
7 白凤凤;;基于不平衡数据集的文本分类技术研究[J];电脑编程技巧与维护;2010年06期
8 张梦笑;王素格;王智强;;基于LDA特征选择的文本聚类[J];电脑开发与应用;2012年01期
9 张红;;基于语义的中文搜索引擎研究[J];电脑知识与技术;2009年08期
10 王成强;;基于不平衡数据集的文本分类技术[J];电脑知识与技术;2009年36期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王静帆;夏云庆;郑方;邬晓钧;;二阶段招聘信息检索方法[A];第九届全国人机语音通讯学术会议论文集[C];2007年
3 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 王明文;付剑波;罗远胜;陆旭;;基于协同聚类的两阶段文本聚类方法研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
6 王珍;维尼拉·木沙江;赵丽红;;维、哈、柯文搜索引擎中自动分类技术的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年
9 蔡嘉荣;印鉴;刘玉葆;黄志兰;;一种有效的文本聚类算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 田萱;杜小勇;李海华;;一种基于语义关系计算领域本体中概念间语义相关度的方法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国硕士学位论文全文数据库 前10条
1 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
2 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
3 许明敏;基于维基百科和web共现分析的概念关系网构建系统研究与实现[D];华东师范大学;2011年
4 王雅菲;文本分类中特征降维方法的研究[D];长春工业大学;2010年
5 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
6 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
7 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年
8 贾俊凯;公安业务文本信息挖掘的研究与实现[D];东华大学;2011年
9 巩军全;文本分类算法的研究与改进[D];西安电子科技大学;2010年
10 黄少冰;基于J2ME的移动网络个性化信息推荐研究[D];西安电子科技大学;2011年
【同被引文献】
中国期刊全文数据库 前2条
1 蒋盛益,李庆华,李新;数据流挖掘算法研究综述[J];计算机工程与设计;2005年05期
2 许厚金;刘永炎;邓成玉;刘永山;;基于相似中心的k-cmeans文本聚类算法[J];计算机工程与设计;2010年08期
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 黄乐;基于支持向量机的网页文本分类技术研究[D];吉林大学;2012年
【二级参考文献】
中国期刊全文数据库 前2条
1 李凡,鲁明羽,陆玉昌;关于文本特征抽取新方法的研究[J];清华大学学报(自然科学版);2001年07期
2 许伟,苑春法,黄昌宁;基于语料库的语言建模[J];清华大学学报(自然科学版);1997年03期
【相似文献】
中国期刊全文数据库 前10条
1 娄军;金添;宋千;周智敏;;高分辨率SAR图像散射中心特征提取[J];电子与信息学报;2011年07期
2 刘真真;李永忠;沈晔华;;基于分形矩的印刷体藏文特征提取方法[J];江南大学学报(自然科学版);2007年06期
3 路志英;杨乐;赵智超;杨玉峰;;沙尘暴综合预报系统中场特征提取方法的研究[J];计算机仿真;2007年06期
4 韩鹏;;文本特征提取技术研究[J];民营科技;2009年04期
5 邹强;冯静;王宇;;基于加窗光谱积分的高光谱遥感图像特征提取[J];信息化纵横;2009年15期
6 全斌;陈淑荞;;图像匹配中点特征提取方法的研究[J];枣庄学院学报;2008年02期
7 孙明柱;魏海平;顿绍坤;王居柱;;SVM网页分类中一种新的特征提取方法[J];科学技术与工程;2011年06期
8 史颜玲;王忠义;;基于形状特征的图像特征提取方法及其在医学图像分析中的应用[J];许昌学院学报;2011年02期
9 延伟东;彭国华;;基于分块FLD的图像特征提取方法[J];科学技术与工程;2006年19期
10 吴梅;李中健;刘小刚;;基于小波数据压缩技术的故障特征提取[J];弹箭与制导学报;2006年04期
中国重要会议论文全文数据库 前10条
1 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
2 张明之;刘雨东;蔡悦斌;;一种基于小波包技术的舰船噪声目标分类特征提取方法[A];水下噪声学术论文选集(1985-2005)[C];2005年
3 姜立军;熊志勇;李哲林;;基于亚像素特征点提取的螺纹检测粗糙聚类[A];中国计算机图形学进展2008--第七届中国计算机图形学大会论文集[C];2008年
4 刘兵;孙超;杨益新;柳革命;;被动声纳目标临界频带频谱能量的特征提取[A];2009年全国水声学学术交流暨水声学分会换届改选会议论文集[C];2009年
5 王艳丰;李钢虎;林关成;;水下目标特征的分形维提取算法改进[A];2009年中国东西部声学学术交流会论文集[C];2009年
6 朱祥玉;侯德文;陈希;;基于双重评估函数的文本特征提取方法[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
7 李勇智;杨静宇;毛洪贲;;基于局部和非局部散度理论的一种新的特征提取方法[A];第二十七届中国控制会议论文集[C];2008年
8 袁骏;肖卉;;基于舰船辐射噪声的听觉特征分析与仿真[A];2009年全国水声学学术交流暨水声学分会换届改选会议论文集[C];2009年
9 郭相科;刘进忙;曹学斌;张玉鹏;;子类独立分量分析在声目标识别中的应用[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
10 李辉;张安;于红梅;;雷达目标识别发展回顾与实现中的关键理论[A];2007年光电探测与制导技术的发展与应用研讨会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 兰州市公安局刑警支队技术大队 李 敏;现场平面足迹的几种拍照提取方法[N];甘肃法制报;2005年
3 ;中药有效成分的提取方法有哪些[N];中国中医药报;2003年
4 陈仕艳;我研究人员提出新的人脸鉴别特征提取方法[N];工人日报;2007年
5 记者 仇逸 杨金志;郑杰代表:慈善捐款不能少审计不公开无监督[N];新华每日电讯;2010年
6 綦晓伟;姜油的提取方法[N];山东科技报;2003年
7 廖建斌 何琳 ;光滑圆柱体上指纹的提取方法[N];人民公安报;2004年
8 陈科茂 李建明;夏天无总生物碱提取方法及新用途获发明专利[N];中国中医药报;2005年
9 中国农业大学食品科学与营养工程学院 马攀 汉麻材料研究中心 何锦风;汉麻籽油的不同提取方法比较[N];中国纺织报;2009年
10 王花俊 张峻松 刘利锋;天然植物香料提取方法研究[N];中国食品质量报;2008年
中国博士学位论文全文数据库 前10条
1 权胜赫;基于形状特征三维模型检索的一些关键技术实现研究[D];吉林大学;2007年
2 朱明;复杂体制雷达辐射源信号时频原子特征研究[D];西南交通大学;2008年
3 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
4 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
5 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
6 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
7 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
8 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
9 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
10 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
中国硕士学位论文全文数据库 前10条
1 邢玉辉;几种重要的三维模型特征提取方法的实现研究[D];吉林大学;2006年
2 邓军国;三维模型检索中几种特征提取方法实现研究[D];西北大学;2009年
3 马章雄;在线掌纹识别系统的研究与开发[D];广东工业大学;2008年
4 金莲芳;基于MPEG-7形状特征的图像检索技术研究[D];广西大学;2005年
5 谭新;基于语义特征提取的PU文本分类的研究与实现[D];吉林大学;2007年
6 王春光;基于小波分析的图像特征提取方法研究[D];国防科学技术大学;2004年
7 张丽春;基于SIFT和SVM的人脸识别研究[D];华东师范大学;2009年
8 蒋伟;基于GIS和KPCA的农业空间数据特征提取研究[D];西南大学;2009年
9 韩征;基于投影特征的SAR自动目标识别技术研究[D];中国民航大学;2009年
10 曹鹏;基于小波变换与蚁群算法的纹理分析方法[D];长沙理工大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026