-
融合检索 & Rerank 在 RAG 中的效果评测
—
in RAGRAG 的基本原理 RAG 的工作流程主要分为两个阶段: Embedding 的缺点 Embedding 的具象化理解可以是,用一组高维数据来表达一段文本的核心内容。如果这段文本非常长,或者包含的内容非常多样化,那么固定维度的 embedding 是很难表达文本的全面内容的。因此:…
-
Gemini Deep Research 是怎样工作的
—
in AgentDeep Research 是什么,为什么值得研究 当我们要在不熟悉的领域研究一个话题时,离不开搜索引擎。传统搜索费时费力,即便是新兴AI搜索(如Perplexity),也多止于浅层问答,难以进行扩展性搜索和深度调研。为此,Deep Research 应运而生:它能将模糊的研究任务拆解细化,在海量网络信息中主动搜索、筛选、乃至反思迭代,最终呈现一份条理清晰、内容详实的研究报告,而非零散观点。 Deep Research 的核心在于其自主思考的智能体(Agent)形态。它能主动规划路径,执行多步探索,并在过程中回顾调整。更关键的是,其背后的模型(如 Gemini)支持高达上百万…
-
当 Vibe Coding 遭遇 Vibe Hiring: Perplexity 的一场实习生招聘风波
—
in Coding这两天 Reddit 上一个吐槽 AI 招聘的帖子火了🔥 原帖的作者来自一家 AI 独角兽(后被指认是 Perplexity),作为招聘者在 Reddit…
-
Mac mini M4 vs. RTX 4090 vs. RTX 2080ti: 部署DeepSeek R1 的效果评测
—
in LLM导语 Apple 最新版 M4 芯片上市后,大家对在 Mac M4 上本地部署 LLM 热情不减。M…
-
深度解密 | DeepSeek R1 + 编程神器 Cline 是如何做到全自动化编程的?
—
in Agent【导语】当爆红的 DeepSeek R1 遇上编程界开挂神器 Cline (🏆OpenRouter工具榜TOP1),是1+1>2的超神组合,还是可怕的 Token 黑洞?实测 Debug 全过程,揭秘…
-
ServiceNow 通过精调 Embedding 模型提升 RAG 的准确性
—
in RAGServiceNow 使用 RAG 技术解决什么问题 曾经简单的研究过 ServiceNow 这家公司的产品,了解到它主要是围绕 ITSM / 低代码领域做企业流程。…
-
RAG 里如何做 Query 优化
—
in RAGRAG 技术的整体流程 RAG (Retrieval-Augmented Generation) 是用来给 LLM 注入特定的知识,解决 LLM 在回答事实…
-
Your Daily LLM & RAG Research Digest
—
in HackerIntroduction The rise of Large Language Models (LLMs), particularly in…
-
海外 VPS 选购对比
—
in Hacker为什么要海外 VPS 如果你搞 SaaS 出海,做独立开发项目,或者搭建一个 WordPress 博客,不想折腾网站备案这些事情,那就要选择海外 VPS,部署在新加坡、日本、北美等地域,让你的目标用户的访问更顺畅。 或者就是想搭一个代理,用来绕过 ChatGPT…
-
多模态的 RAG:工作流、评测框架和结果
—
in RAG什么是多模态 RAG 真正的多模态 RAG 是指,检索环节支持多模态,生成环节也支持多模态,Multi-modal Retrieval & Multi-modal Generation。多模态(图、文)混排的输出比纯文本(包括Markdown 格式化)的用户体验好很多,图片本身易读、易理解,图片比文字更具象化。…
-
MinerU项目的研究分析
—
in HackerMinerU产品体验 介绍 MinerU 可以把 PDF 转成 markdown/json 文件,支持提取 Table、Image、LaTex 公式,能保证…
-
Poppler: 超强的 PDF 转换和导出工具
—
in Hackerpoppler 是一个用于 PDF 提取、转换、修改等用途的 lib 库,功能强大,速度飞快。 本文里使用 https://arxiv.org/abs/2411.03628 这篇 PDF…
-
怎样做到 LLM Long-Context 越长 RAG 性能越好
总结 这篇来自 Google DeepMind 的论文 “Inference Scaling for Long-Context Retrieval…