Heycc's blog – Page 4 – I blog about AI, product, develop

GNN-RAG: 用于 LLM 推理的图神经检索

Jun 4, 2024

—

in RAG

GNN

标题 https://arxiv.org/pdf/2405.20139v1 总结 GNN-RAG 是一种结合了大型语言模型（LLMs）和图神经网络（GNNs）的检索增强生成（RAG）框架，用于知识图谱问答（KGQA）任务，通过GNN在密集的KG子图上进行推理来提取答案候选和推理路径，然后将这些信息转化为文本并输入给LLM进行RAG，以提高复杂问题的答题准确性和效率。摘要本网页介绍了一种名为GNN-RAG的知识图谱问答（KGQA）方法，该方法通过结合图神经网络（GNNs）和大型语言模型（LLMs）的优势，提出了一种新的检索增强生成（RAG）框架。GNN-RAG首先利用GNN在密集的KG子图上进行推理，以检索与给定问题相关的答案候选和最短推理路径。然后，将这些路径转化为文本，并与LLM结合使用RAG进行问题答案的生成。该方法在两个广泛使用的KGQA基准数据集（WebQSP和CWQ）上实现了最先进的性能，特别是在多跳和多实体问题上，超越了现有的GPT-4性能，并且使用了一个70亿参数的调优LLM。此外，GNN-RAG通过增强检索（RA）技术进一步提升了KGQA的性能，该技术结合了GNN和LLM的检索方法。实验结果表明，GNN-RAG在不增加额外LLM调用的情况下，提高了KGQA的性能，并且在使用70亿参数的LLM时，与GPT-4的性能相匹敌或超越。观点现有方案实验数据…
使用图神经网络（GNN）重排来改进 RAG

Jun 3, 2024

—

in RAG

Google UCLA

标题 https://arxiv.org/pdf/2405.18414v1 总结本研究提出了一种基于图神经网络（GNN）的重排器G-RAG，用于改善基于检索增强的生成（RAG）系统的开放领域问答（ODQA）性能，通过利用文档间的隐含连接和抽象意义表示（AMR）图来增强文档重排。摘要本文首先介绍了RAG系统在开放领域问答（ODQA）中的应用，指出尽管RAG系统在提取相关文档方面取得了进展，但它未能充分利用文档间的连接。为了解决这个问题，研究者们提出了一种基于图神经网络的重排器G-RAG，它通过构建文档图和利用AMR图的语义信息来改善文档的重排。G-RAG的方法是首先为每个问题-文档对生成AMR图，然后在这些图中建立文档间的连接，最后使用图神经网络对文档进行重排。该研究还提出了新的评估指标，以更公平地处理排名时的平局问题。实验结果表明，G-RAG在多个数据集上的表现优于现有的最佳方法，并且具有更小的计算足迹。此外，研究人员还评估了大型语言模型PaLM 2作为重排器的性能，发现即使是大型预训练语言模型，也无法达到G-RAG的性能水平。观点实验数据
HippoRAG: 基于神经生理理论的长期记忆框架

May 31, 2024

—

in RAG

Multi-hop OSU

标题 HippoRAG: Neurobiologically InspiredLong-Term Memory for Large Language Models 总结…
RaFe: Ranking Feedback Improves Query Rewriting for RAG

May 29, 2024

—

in RAG

Query Rewrite

标题 RaFe: Ranking Feedback Improves Query Rewriting for RAG 总结…
AGRAME: Any-Granularity Ranking with Multi-Vector Embeddings

May 28, 2024

—

in RAG

Embedding

标题 AGRAME: Any-Granularity Ranking with Multi-Vector Embeddings 总结本研究引入了AGRAME（Any-Granularity Ranking…
RE-Adapt: LLM 的逆向工程适配器

May 28, 2024

—

in LLM

Fine-tune

标题 RE-Adapt: Reverse Engineered Adaptation of Large Language Models 总结…
FlashRAG: 为 RAG 研究而生的模块化工具包

May 27, 2024

—

in RAG

标题 FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research…
IM-RAG: 基于学习内在思维的多轮 RAG

May 27, 2024

—

in RAG

UCSC

标题 IM-RAG: Multi-Round Retrieval-Augmented Generation Through Learning Inner Monologues 总结…
Prompt-based Code Completion via Multi-Retrieval Augmented Generation

May 25, 2024

—

in RAG

Code Kuaishou Sustech

总结本网页主要介绍了一种名为 ProCC 的代码自动完成框架，它通过多重检索增强的生成（Multi-Retrieval Augmented Generation）技术，结合提示工程和上下文多臂赌博机算法，以多角度理解代码语义，提高代码自动完成的准确性和效率。摘要网页详细介绍了 ProCC 框架的设计和实现，它包括两个主要组件：基于提示的多重检索器系统和自适应检索选择算法。基于提示的多重检索器系统通过设计三种不同的提示模板来理解代码语义，分别是词法语义、假设行和代码摘要三个视角。自适应检索选择算法则利用上下文多臂赌博机算法，根据不同的代码上下文动态选择最合适的检索视角，以提供最佳的上下文支持。实验结果表明，ProCC…
控制令牌 (CT) 结合密集段落检索 (DPR) 模型

May 25, 2024

—

in SearchENgine

Intent

总结本研究通过引入控制令牌（Control Token, CT）并结合密集段落检索（Dense Passage Retrieval, DPR）模型，提高了大型语言模型（LLMs）中的信息检索准确性，特别是在特定领域的文档检索方面。摘要研究团队采用了基于深度学习的搜索引擎技术，即密集段落检索（DPR）模型，并通过引入控制令牌（CT）来增强其性能。CT 是一种特殊的令牌，用于表示查询的意图类别，它通过与查询和文档文本结合，帮助模型更准确地理解用户的检索意图。研究选择了…