March 17, 2024Open Access

StyleChat：在大型语言模型中学习背诵增强记忆以生成风格化对话

Key Points

Key points are not available for this paper at this time.

Abstract

大型语言模型（LLMs）在生成任务中表现出卓越性能，受到广泛关注。其中，风格化对话生成对于构建智能且富有吸引力的对话代理至关重要。然而，LLMs 的能力依赖于数据驱动并受限于数据偏差，导致在特定任务上的表现不佳。尤其是，风格化对话生成严重缺乏监督数据。此外，尽管提出了许多基于提示的方法以完成特定任务，但它们在涉及多样对话风格的复杂真实场景中的表现仍有待提升。在本工作中，我们首先通过全面利用LLMs的生成能力引入了包含38种风格的风格化对话数据集StyleEval，该数据集经过严格的人为质量控制精心构建。在此基础上，我们提出了风格化对话框架StyleChat，采用背诵增强记忆策略和多任务风格学习策略，以促进泛化能力。为了评估我们方法的有效性，我们创建了包含生成任务和选择任务的测试基准，全面评估训练模型并判断是否能够记忆和理解风格及偏好。实验结果表明，我们提出的框架StyleChat优于所有基线方法，有助于突破LLMs的风格局限。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jinpeng Li

Zekai Zhang

Quan Tu

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

StyleChat：在大型语言模型中学习背诵增强记忆以生成风格化对话

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider