Reducing hallucination in structured outputs via Retrieval-Augmented Generation

May 14, 2024

—

in RAG

Workflow

一句话介绍

主要介绍了一种使用检索增强生成（RAG）技术来减少生成性人工智能（GenAI）中幻觉现象的方法，并在工作流程 (workflow) 生成任务中实际应用了这种方法。
by heycc

业务场景

把用户的自然语言转换成 json 结构化的 workflow。ServiceNow 面对的 workflow 是 ITSM、HR、财经等企业内的信息化流程

为什么要训练

把自然语言转换为 Code 或者 SQL 已经非常普遍了，但是在 ServiceNow 的业务场景下，需要把自然语言转换为企业内 specific 的 workflow，涉及指定 table、step 名称，还需要产生 json 结构的 workflow 输出。所以需要 fine-tune retrieval 和 LLM 模型

基于什么模型训练

Retrieval 模型：某个基于 SentenceTransformer 框架的模型出于部署成本考虑，LLM 模型选择 7B。

retrieval 模型更小，可以基于 CPU 部署

评测结果如何

召回率评测：基础召回模型，即使选择不同的参数大小，召回率基本不变；

精调后的模型，叠加多种采样策略后，整体召回率显著优于基础模型

Heycc's blog