面向新闻媒体的可控评论文本生成方法研究
文献类型:学位论文
作者 | 邹瀚仪![]() |
答辩日期 | 2024-05 |
文献子类 | 硕士 |
关键词 | 可控新闻评论文本生成 属性可控性 语境相关性 新闻评论回复生成 多轮反馈提示 |
英文摘要 | 随着互联网技术的发展,在线新闻平台逐渐成为大众获取外界资讯的主要途径,在新闻平台上发表评论成为人们交流思想、表达观点的一种重要方式。然而,在实际场景中,由于通常只有少数用户会积极参与评论,造成新闻媒体平台的活跃度和互动性不足。而且,由于个人喜好、主观看法等因素的不同,有可能出现不友好的负面评论,这些负面评论会对用户造成心理影响和打击,并极大地影响良性的社区互动氛围和用户体验。为了有效应对以上问题,本论文提出可控新闻评论文本生成任务并建立针对该任务的技术和方法。可控新闻评论文本生成可以简化用户的评论撰写过程,根据用户需求生成多条候选评论供用户选择,提高用户参与评论的积极性,从而提升新闻媒体平台的活跃度。此外,通过引入可控因素,新闻媒体平台可以主动地塑造评论的风格特点,以减少负面和恶意评论的生成,从而创造更加积极、友好的社交环境和社区互动氛围,并促进社会和谐发展和进步。新闻评论的可控生成过程涉及多种语言认知和处理能力,如新闻内容理解、评论观点融合以及自然语言表达等,是社会媒体计算、文本数据挖掘、自然语言生成等多个学科交叉的研究方向,因而具有重要的研究意义。 不同于可控文本生成任务,可控新闻评论文本生成任务需要同时考虑语境相关性和属性可控性两方面的约束,因而面临如何充分挖掘新闻上下文语义信息和如何在新闻评论中融合控制条件这两个挑战。现有的可控文本生成方法由于缺乏对上下文的理解以及对生成文本的主旨规划,直接将其迁移到可控新闻评论生成任务中会导致生成文本仅能保证符合属性条件的约束,而其他隐含条件如新闻上下文语境相关性以及新闻评论的多样性要求无法得到满足。而现有的新闻评论自动生成方法忽略了对生成评论的属性控制,也忽略了新闻评论与新闻内容的关联关系,导致生成评论的方向不可控,且自动生成的评论呈现低语境相关性。针对现有新闻评论生成工作存在的问题和挑战,本论文首先提出可控新闻评论文本生成任务,并在新闻评论文本生成中引入可控性,建立基于属性约束的可控新闻评论生成方法;其次,考虑新闻评论与新闻内容的关联关系,提出语境相关性增强的可控新闻评论生成方法;最后,在新闻评论的基础上拓展评论结构,提出基于增强提示的新闻评论可控回复生成方法。 本论文的主要工作和研究贡献归纳如下: 1.为了实现新闻评论的可控生成,提出可控新闻评论生成任务并建立基于属性级别对比学习的可控新闻评论生成方法。该方法通过交互注意力层建模控制属性与新闻内容的交互特征,从而确保生成评论中包含新闻内容中的重要信息和控制属性特征。此外,通过构建属性级正负样本,将对比学习引入可控评论生成任务中,将属性相同的生成评论和真实评论视为同一属性下的不同视图,在训练时拉近两者之间的距离,提升模型的属性控制准确率。在四个数据集上的实验结果表明所提出方法能够有效约束生成评论的属性。 2.以往的新闻评论生成研究忽略了评论与新闻内容之间的关联关系,缺乏对语境相关信息的有效利用。为了提升生成评论的语境相关性,提出语境相关性增强的可控新闻评论生成方法,该方法基于变分自编码器构建一个后验信息监督的先验网络来提取新闻内容中潜在的语境相关信息,并将该潜在语境信息融入解码器中实现语境相关的新闻评论生成。然而由于序列到序列模型的顺序特性,解码器层会逐渐忽略潜在语境信息从而导致模型退化,为此,提出基于低秩张量积的分层融合方法以增加语境信息与解码器的耦合程度。 3.为了对复杂新闻评论结构进行探索,提出基于增强提示的新闻评论可控回复生成方法。该方法借助大语言模型的通用语言理解和生成能力,通过文本特征增强提示模块和反馈提示模块实现新闻评论可控回复生成。文本特征增强提示模块基于机器学习方法提取数据集中新闻评论的文本特征,并构建文本特征增强的自然语言提示语,用于提升生成回复的文本特征一致性。反馈提示模块利用属性判别模型对生成回复进行属性判别,根据属性判别模型的反馈动态调整提示语与大语言模型进行多轮对话,提升生成回复的属性准确率。在四个数据集上的实验验证了提出方法能够提升属性控制准确率和文本特征一致性。 |
学科主题 | 自然语言处理 |
语种 | 中文 |
页码 | 66 |
源URL | [http://ir.ia.ac.cn/handle/173211/57536] ![]() |
专题 | 毕业生_硕士学位论文 |
推荐引用方式 GB/T 7714 | 邹瀚仪. 面向新闻媒体的可控评论文本生成方法研究[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。