面向长尾分布的视觉识别关键技术研究
文献类型:学位论文
作者 | 李俊![]() |
答辩日期 | 2024-05 |
文献子类 | 硕士 |
关键词 | 长尾分布 协同学习 视觉语言多模态大模型 高效提示指令微调 |
英文摘要 | 在符合现实世界数据分布的数据集上取得良好表现是一个模型走向实际部署应用的重要一步,然而现实世界数据分布通常呈现出长尾分布,这对现有的很多算法带来了挑战。长尾分布数据给模型训练带来的问题大致可以分为两个方面,一个是头部和尾部类别训练样本数差距过大导致模型对尾部类别的预测准确率明显偏低,另一个是尾部类别样本数太少,代表性不足,难以提供丰富的信息。本文从这两个方面出发,基于深度学习方法,对当前研究存在的一些问题进行了深入研究并提出了相应的解决办法,总结起来本文的贡献如下: |
语种 | 中文 |
页码 | 78 |
源URL | [http://ir.ia.ac.cn/handle/173211/57129] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 李俊. 面向长尾分布的视觉识别关键技术研究[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。