中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于加油数据的车辆画像研究

文献类型:学位论文

作者张树勋
答辩日期2019-05-23
授予单位中国科学院大学
授予地点中国科学院新疆理化技术研究所
导师马玉鹏
关键词数据分析 机器学习 聚类 用户画像
学位名称硕士
学位专业计算机技术
英文摘要

物联网技术近年来飞速发展,应用深入到社会的方方面面。广泛部署的传感器传回的海量数据不断积累在后端的数据库中。如何利用这些通常仅仅是储存起来的数据为社会服务,实现从数据到价值的飞跃,引起了广泛的研究兴趣。 本文基于某地区的物联网数据平台采集的车辆加油日志数据。为了使得累积的数据发挥作用,方便快捷地为城市规划、道路交通发展提供有价值的参考信息,本文采用用户画像分析技术,通过对日志数据进行清洗与用户聚类,获取了该地区的车辆画像信息。本文围绕车辆画像,开展了以下四个方面的工作: 1、本文对混杂的日志数据进行了数据清洗,获得了较为干净的数据。并探索了这些数据值的分布,获得了对日志数据的基本认知; 2、本文分析了清洗后的原始数据,为数据设计了合适的特征结构,将原始的日志数据转化为适合于机器学习的特征向量; 3、采用K-means、Birch等多种聚类算法,对清洗后的数据进行了用户聚类;然后采用两种评估指标衡量了用户聚类的质量,根据评估指标进一步优化了特征选择和聚类结果。 4、为聚类后的车辆拟定了画像标签,并根据采集到的部分车辆的真实信息,对画像效果进行了验证。 本文通过对数据的深入研究,构造了车辆画像的特征结构。分析了多轮实验结果,本文采用K-means++算法和部分有效特征获取到了车辆最终画像。经过验证,本文获取到的车辆画像信息具有很高的准确率。

页码53
源URL[http://ir.xjipc.cas.cn/handle/365002/5997]  
专题新疆理化技术研究所_多语种信息技术研究室
推荐引用方式
GB/T 7714
张树勋. 基于加油数据的车辆画像研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2019.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。