收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于t-SNE的恒星光谱降维与分类研究

姜斌  赵梓良  王淑婷  韦纪宇  曲美霞  
【摘要】:随着天文学的发展以及天文望远镜观测能力的提升,国内外许多大型巡天望远镜将产生PB级的恒星光谱数据。恒星光谱是来自恒星的电磁辐射,通常由连续谱与吸收线叠加而成,其差异源于恒星的有效温度、表面重力加速度以及元素的化学丰度等。恒星光谱自动分类是天文数据处理的一项重要研究内容,是研究恒星演化和参数测量的基础。海量的恒星光谱对分类方法提出了高效、准确的要求。传统的人工分类方法存在速度慢、精度低等缺点,已经无法满足海量恒星光谱特别是低信噪比恒星光谱自动分类的实际需要,机器学习算法目前已经被广泛地应用于恒星光谱分类。恒星光谱的一个显著特征是数据维度较高,降维不但可以实现特征提取,而且可以降低计算量,是光谱分类的首要任务。传统的线性降维方法如主成分分析仅依据方差对光谱进行降维,不同类型的光谱在投影到低维特征空间后会出现交叉现象,而流形学习能够产生优良的分类边界,很好地避开重叠,有利于后续的分类。针对光谱数据维度较高的特点,研究了光谱数据在高维空间内的分布以及流形学习对高维线性数据降维的原理,比较了t-SNE和主成分分析两种降维方法对光谱数据降维的效果,并使用基于属性值相关距离的改进的K近邻算法进行光谱分类,最终对实验结果进行了分析并使用多种机器学习分类器进行比较和验证。采用Python语言及Scikit-learn第三方库实现了算法,对SDSS的12 000条低信噪比的恒星光谱进行实验,最终实现了光谱数据的高精度自动处理和分类。实验结果表明,对于光谱数据的降维处理,基于流形学习的t-SNE方法能够在高维光谱数据中恢复低维流形结构,即找出高维空间中的低维流形,并解出与之对应的嵌入映射,在降维过程中最大程度地保留不同类别光谱样本之间的差异从而产生明显的分类边界。特征提取后,使用机器学习分类器能够在测试数据集上达到满意的分类准确率。所使用的方法也可以应用于其他的巡天望远镜产生的海量光谱的自动分类以及稀少天体的数据挖掘。

知网文化
【相似文献】
中国期刊全文数据库 前16条
1 刘忠宝;任娟娟;宋文爱;张静;孔啸;富丽贞;;基于熵学习机的恒星光谱分类(英文)[J];光谱学与光谱分析;2018年02期
2 覃冬梅,胡占义,赵永恒;一种基于主分量分析的恒星光谱快速分类法[J];光谱学与光谱分析;2003年01期
3 李加林;恒星光谱分析[J];陕西师大学报(自然科学版);1995年S1期
4 石超君;邱波;周亚同;段福庆;;基于卷积神经网络的恒星光谱自动分类方法[J];光谱学与光谱分析;2019年04期
5 王楠楠;邱波;马杰;石超君;宋涛;郭平;;一种基于卷积神经网络的恒星光谱快速分类法[J];光谱学与光谱分析;2019年10期
6 吴明磊;潘景昌;衣振萍;韦鹏;;低信噪比巡天数据中特殊恒星光谱的搜寻方法[J];光谱学与光谱分析;2019年02期
7 薛仁政;陈淑鑫;黄宏本;;A型恒星光谱线指数岭回归有效温度的预测分析[J];光谱学与光谱分析;2019年08期
8 刘杰;潘景昌;吴明磊;刘聪;韦鹏;衣振萍;刘猛;;早M型矮恒星光谱聚类方法与分析[J];光谱学与光谱分析;2017年12期
9 刘忠宝;秦振涛;罗学刚;周方晓;张靖;;利用融合数据分布特征的模糊双支持向量机对恒星光谱分类[J];光谱学与光谱分析;2019年04期
10 张静;刘忠宝;宋文爱;富丽贞;章永来;;基于多类支持向量机的恒星光谱分类方法[J];光谱学与光谱分析;2018年07期
11 刘忠宝;雷宇飞;宋文爱;张静;王杰;屠良平;;利用带无标签数据的双支持向量机对恒星光谱分类[J];光谱学与光谱分析;2019年03期
12 潘景昌;张彩明;韦鹏;罗阿理;赵永恒;;自动识别发射线恒星光谱的新方法[J];光谱学与光谱分析;2012年06期
13 张静敏;许婷婷;杜利婷;周卫红;;基于深度信念网络的LAMOST恒星光谱分类研究[J];大理大学学报;2019年06期
14 潘景昌;王杰;姜斌;罗阿理;韦鹏;郑强;;一种基于Map/Reduce分布式计算的恒星光谱分类方法[J];光谱学与光谱分析;2016年08期
15 翟迪生,蒋世仰;高信噪比恒星光谱工作热点[J];天文学进展;1991年02期
16 张枭;罗阿理;;基于XGBOOST的恒星光谱分类特征数值化[J];光谱学与光谱分析;2019年10期
中国重要会议论文全文数据库 前4条
1 韦鹏;;LAMOST DR1恒星光谱数据的数据挖掘[A];2013中国天文学会学术年会文集[C];2013年
2 张立云;;基于郭守敬望远镜恒星光谱库研究大样本晚型恒星的色球活动(英文)[A];2013中国天文学会学术年会文集[C];2013年
3 陆洪鹏;;基于郭守敬望远镜恒星光谱库研究大样本恒星的色球活动[A];中国天文学会2016年学术年会摘要集[C];2016年
4 李申;姜碧沩;;8000-9200中分辨率恒星光谱分析——LAMOST银河系研究的实验观测[A];中国天文学会恒星分会2004年学术年会论文集[C];2004年
中国硕士学位论文全文数据库 前3条
1 卢宇翔;基于多任务残差神经网络的恒星光谱分类研究[D];山东大学;2020年
2 韩晨;基于低分辨率LAMOST恒星光谱估算α元素丰度[D];河北师范大学;2015年
3 王杰;Hadoop环境下基于Lick线指数的恒星光谱分类与参数测量[D];山东大学;2015年
中国重要报纸全文数据库 前1条
1 记者 李大庆;LAMOST获取海量银河系恒星光谱[N];科技日报;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978