时空知识图谱驱动的旅游决策推理模型研究
文献类型:学位论文
作者 | 高嘉良 |
答辩日期 | 2023-12 |
文献子类 | 学术型学位 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院地理科学与资源研究所 |
导师 | 陆锋 |
关键词 | 知识图谱 多模态时空数据 地理空间人工智能 可解释性推荐模型 时空知识推理 旅游管理 |
学位名称 | 博士 |
学位专业 | 地图学与地理信息系统 |
英文摘要 | 旅游业作为以市场为导向的第三产业,已然成为全球经济快速增长的重要驱动力。当前,受到疫情和百年变局等因素的叠加影响,旅游业处于一个非平稳、不确定、模糊复杂的市场环境,亟需采取相应的对策,推动旅游业的快速复苏。在此背景下,如何准确地洞悉游客市场的变化特征,全面厘清旅游业的发展演化规律,并针对现有产业结构性问题,进行长期科学规划,对于支撑我国旅游业应对‘后疫情时代’的复杂新形式,从而实现旅游市场的有序恢复并达到新的发展水平,具有重要的科学意义。 当前,随着Web2.0与基于位置服务技术的不断成熟,各种形式的海量用户生成内容源源不断地产生与发布。游客们通过签到、评论、游记、攻略等多种数据形式,记录和呈现其行为、偏好、需求以及感知。尽管此类旅游时空数据具有规模庞大、更新迅速、易于获取等显著优势,但在采集、处理、挖掘和应用过程中,也体现出时空大数据所特有的多模态异构、非目的性记录、低价值密度以及有偏性等特性。因此,如何将上述的多源异构时空大数据转化为结构化的旅游知识,突破“数据过载、信息爆炸、知识匮乏”的瓶颈,从而形成对旅游产业科学管理与可持续发展战略的决策支持智慧,是当前亟待解决的关键问题。 知识图谱及其相关的技术方法为上述问题,提供了一种切实可行的解决方案。知识图谱是以<头实体,关系,尾实体>三元组所构成的大规模语义网,具有高度灵活与可扩展的数据结构优势。随着以大规模预训练语言模型为代表的自然语言处理技术日趋成熟,信息抽取与知识获取任务的精确性和效率显著提升,极大降低了知识图谱的构建成本。同时,通过结合图数据管理系统与知识图谱嵌入表示、图神经网络等技术,可实现对图谱中结构化知识的高效调配与推理,在多种下游任务提供强大的应用支撑,包括语义搜索、智能问答和推荐系统等。相较于通用知识图谱主要以网络百科为基础构建数据源,旅游时空数据的信息抽取与知识发现过程更加复杂和多样化。旅游活动与现象发生于真实的物理空间,并受到时空因素的制约,体现出显著的时空规律特性。因此,本文将知识图谱及其相关技术方法引入旅游管理领域,并基于多模态旅游时空数据开发具有针对性的时空信息抽取与知识发现算法,从而定义、设计和构建旅游时空知识图谱。在此基础上,本文开展新的时空知识表示与显式推理模型研究,解决旅游场景中的多种具体决策支持任务,充分发挥时空知识图谱的计算应用潜能。 在知识图谱的知识实例层,本文针对三种主要模态类型的多源异构时空数据:网络文本语料、游客电子足迹、基础地理数据,分别采用了大规模预训练语言模型ERNIE、多尺度复杂网络分析、相对空间关系计算,将其抽取/转化为结构统一的知识三元组。随后,本文根据旅游领域专家知识与既定行业规范,综合考虑了在线旅游语境特征,采取自上而下的构建方式,设计了旅游时空知识图谱的概念模式层,其既包含数值型的绝对空间属性,也涵盖了更符合人们认知的相对空间关系型知识。在此本体基础上,本文对结构化知识三元组进行对齐、消歧和融合,最终构建出完整的旅游时空知识图谱。在实际应用层,根据具体的下游任务,该旅游时空知识图谱可灵活拆分/组合为3种子图:功能语义子图、地理空间子图、游客行为子图,分别侧重于不同类型/侧面的场景因素知识。该旅游时空知识图谱共包含77,039个实体和43种关系,共计10,971,810个三元组,覆盖全国340个地级及以上城市。 基于所构建的旅游时空知识图谱,本文采取了两种决策支持应用策略:符号化查询式与分布型推理式,并尝试将两者进行结合。符号化查询式可相对直接地展现图谱的知识内容与效用价值,其借助图数据库查询语言SPARQL,对结构化知识进行高效调配/返回,以支持于多重时空统计分析,形成了对游客行为偏好的规律特征、形成机理以及潜在影响的全面探究。分布型推理式则更进一步体现出知识图谱的知识表示和计算推理能力,本文针对两个具体旅游应用场景,即景点竞争关系推断和游客—景点可解释推荐系统,分别设计和开发了基于时空知识图谱的知识推理模型。具体而言,本文为了识别出同目的地内景点之间潜在的竞争关系,提出了一个新的基于图神经网络的Competitor-GAT模型,通过地理空间编码与知识图谱嵌入表示两种模块,将景点的地理空间区位与功能语义特征两种语境知识进行充分融合表示,在游客行为子图上通过距离中介后的图注意力机制进行知识特征的聚合、传播、更新,最终对竞争关系进行了精准预测。可解释的景点推荐算法KGDAE,通过将知识图谱作为弱监督信号引入自编码机框架,通过设计多层注意力机制,对海量游客历史行为数据进行了多尺度解纠缠表示学习,解析了其决策因子以及之间的互作用过程,从而实现在供给侧为目的地发展规划直接提供决策依据,在需求侧大幅提升了出游推荐系统的可靠性、可解释性和鲁棒性。 本文所构建的旅游时空知识图谱,以及基于此所提出的多种应用决策支持模型,具有以下3点理论创新与实际贡献:1)旅游时空知识图谱为多源异构的时空大数据提供了灵活的知识表达与融合集成框架,通过运用多种高效的信息抽取与知识发现方法,实现了统一结构化的知识三元组获取、消歧和对齐,对复杂多变的旅游时空场景进行了全方位的刻画和理解。2)基于旅游时空知识图谱构建了一种新的空间显式GeoAI模型,为人工智能领域的符号主义与连接主义提供理论上的连接桥梁。第一,通过知识图谱嵌入表示学习,将三元组结构映射到连续的隐式向量空间,提升了模型对符号化知识具有更好的特征表示和计算能力,便于与图神经网络等下游任务模型进行融合、推断;第二,通过设计多种精细化的注意力机制,将游客兴趣、决策过程在知识图谱上进行显式化推演,充分发挥知识图谱的符号化特性,揭示出自原因到结果的信号传播路径,为基于深度学习的人工智能模型提供了可视化解释;第三,进一步提升GeoAI模型的鲁棒性、可泛化性与可迁移性,有效避免模型对稀疏小样本数据的过拟合现象。3)基于覆盖全国、长时序、精细粒度的旅游时空知识图谱,本文对中国游客的出游行为偏好、决策过程,以及旅游目的地产业发展模式进行了全方位探究,形成了从一般性规律到形成机理再到潜在影响的逐层递进的系统性分析,对国内旅游市场进行全面把控与深入洞察,为旅游业长期、可持续发展规划提供了科学的决策支撑。 |
学科主题 | 地图学与地理信息系统 |
语种 | 中文 |
页码 | 169 |
源URL | [http://ir.igsnrr.ac.cn/handle/311030/209345] ![]() |
专题 | 地理科学与资源研究所_研究生部 |
推荐引用方式 GB/T 7714 | 高嘉良. 时空知识图谱驱动的旅游决策推理模型研究[D]. 中国科学院地理科学与资源研究所. 中国科学院大学. 2023. |
入库方式: OAI收割
来源:地理科学与资源研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。