中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度学习的恒星光谱分类

文献类型:学位论文

作者王天翔
答辩日期2021-07-01
文献子类硕士
授予单位中国科学院大学
授予地点北京
导师范玉峰
关键词恒星光谱 MK分类 深度学习 回归 特征映射
学位专业天文技术与方法
其他题名Stellar Spectrum Classification Based on deep learning
英文摘要近年来,随着各大光谱巡天项目的陆续实施,观测得到的天体光谱数据急剧增长。为了能对海量的天体光谱数据进行有效利用,我们对恒星光谱分类和深度学习方法进行了研究,参考国内外相关研究的文献,提出了对恒星光谱进行MK自动分类的深度学习方法。在光谱型分类方面,因为光谱型代表的是恒星温度,本文将光谱型分类问题转化为温度的回归问题,设计了深度残差网络对光谱类别进行预测。模型的主体由残差网络构成,主要包括卷积层,最大池化层,平均池化层,全连接层以及残差结构。最大池化层用来筛选特征,卷积层用于提取特征,平均池化层用于减少模型参数,提高效率。残差结构可以防止网络退化,加深网络来提取高维抽象特征以及提高训练速度,同时我们还在模型上加入了注意力机制。考虑到光谱有非零几率存在错误标签以及损坏的情况,本文采用Log-Cosh作为损失函数来降低坏样本带来的负面影响。实验数据使用的是从LAMOST、SDSS等光谱库中随机抽取的恒星光谱,由于光谱质量等原因,每个光谱型的光谱数量不一。经过剔除坏值,流量归一化后,按7:1:2分割数据集。实验包括两个部分,第一个部分是使用数据集训练网络在光谱次型上进行类别预测,使用最大绝对误差、平均绝对误差以及标准差来比较不同形状卷积核的性能。将预测值作为横坐标,标签作为纵坐标,对测试集所有样本点使用线性拟合和二阶非线性拟合,得到了一条与y = x基本重合的直线,证明模型可以很好的预测光谱次型。第二部分是对模型进行内部分析,使用类别激活映射的方法分别研究了模型预测A、F、G、K四种类型光谱时所关注的主要特征,赋予了模型可解释性。在文中数据集上,该方法取得了平均绝对误差为0.4个光谱次型的优秀预测结果。与非参数回归、Adaboost回归树、K-Means三种方法进行同数据集比较,结果表明文中提出的方法可以很好地预测光谱次型并且速度更快,准确率更高。在光度型方面,由于光度型分类依赖于谱线的细微变化,对于此,本文采用多尺度卷积模型提取谱线特征,主要包括卷积层、ReLU激活层、批归一化层、Softmax层和全连接层。由于光度型的有标签数据稀少,本文利用迁移学习思想,先将模型在光谱型数据集上进行预训练,然后在光度型数据集上进行微调。由于数据集类不平衡,本文在微调时使用Focal Loss作为损失函数,以此来提升训练效果,最后将结果与相关研究中的算法进行了比较分析。
学科主题天文学 ; 恒星与银河系 ; 计算机科学技术 ; 人工智能 ; 计算机应用
语种中文
页码75
源URL[http://ir.ynao.ac.cn/handle/114a53/25489]  
专题云南天文台_丽江天文观测站(南方基地)
作者单位中国科学院云南天文台
推荐引用方式
GB/T 7714
王天翔. 基于深度学习的恒星光谱分类[D]. 北京. 中国科学院大学. 2021.

入库方式: OAI收割

来源:云南天文台

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。