-
MinerU项目的研究分析
—
in HackerMinerU产品体验 介绍 MinerU 可以把 PDF 转成 markdown/json 文件,支持提取 Table、Image、LaTex 公式,能保证…
-
Poppler: 超强的 PDF 转换和导出工具
—
in Hackerpoppler 是一个用于 PDF 提取、转换、修改等用途的 lib 库,功能强大,速度飞快。 本文里使用 https://arxiv.org/abs/2411.03628 这篇 PDF…
-
怎样做到 LLM Long-Context 越长 RAG 性能越好
总结 这篇来自 Google DeepMind 的论文 “Inference Scaling for Long-Context Retrieval…
-
基于 ColBERT 检索和集成响应评分的语言模型问答
ColBERT Retrieval and Ensemble Response Scoring for Language Model Question…
-
Databrick 对 Long Context RAG 的评测
—
in RAG整体结果 四项评测集的平均正确率 DocQA 的正确率 HotpotQA 的正确率 评测方案 评测方案中的主要设置 retrieval 阶段…