Heycc's blog

  • Home
  • 融合检索 & Rerank 在 RAG 中的效果评测

    融合检索 & Rerank 在 RAG 中的效果评测

    May 16, 2024

    —

    in RAG

    RAG 的基本原理 RAG 的工作流程主要分为两个阶段: Embedding 的缺点 Embedding 的具象化理解可以是,用一组高维数据来表达一段文本的核心内容。如果这段文本非常长,或者包含的内容非常多样化,那么固定维度的 embedding 是很难表达文本的全面内容的。因此:…

  • Gemini Deep Research 是怎样工作的

    May 12, 2025

    —

    in Agent

    Deep Research 是什么,为什么值得研究 当我们要在不熟悉的领域研究一个话题时,离不开搜索引擎。传统搜索费时费力,即便是新兴AI搜索(如Perplexity),也多止于浅层问答,难以进行扩展性搜索和深度调研。为此,Deep Research 应运而生:它能将模糊的研究任务拆解细化,在海量网络信息中主动搜索、筛选、乃至反思迭代,最终呈现一份条理清晰、内容详实的研究报告,而非零散观点。 Deep Research 的核心在于其自主思考的智能体(Agent)形态。它能主动规划路径,执行多步探索,并在过程中回顾调整。更关键的是,其背后的模型(如 Gemini)支持高达上百万…

  • 当 Vibe Coding 遭遇 Vibe Hiring: Perplexity 的一场实习生招聘风波

    当 Vibe Coding 遭遇 Vibe Hiring: Perplexity 的一场实习生招聘风波

    May 1, 2025

    —

    in Coding

    这两天 Reddit 上一个吐槽 AI 招聘的帖子火了🔥 原帖的作者来自一家 AI 独角兽(后被指认是 Perplexity),作为招聘者在 Reddit…

  • Mac mini M4 vs. RTX 4090 vs. RTX 2080ti: 部署DeepSeek R1 的效果评测

    Mac mini M4 vs. RTX 4090 vs. RTX 2080ti: 部署DeepSeek R1 的效果评测

    Feb 21, 2025

    —

    in LLM

    导语 Apple 最新版 M4 芯片上市后,大家对在 Mac M4 上本地部署 LLM 热情不减。M…

  • 深度解密 | DeepSeek R1 + 编程神器 Cline 是如何做到全自动化编程的?

    深度解密 | DeepSeek R1 + 编程神器 Cline 是如何做到全自动化编程的?

    Feb 11, 2025

    —

    in Agent

    【导语】当爆红的 DeepSeek R1 遇上编程界开挂神器 Cline (🏆OpenRouter工具榜TOP1),是1+1>2的超神组合,还是可怕的 Token 黑洞?实测 Debug 全过程,揭秘…

  • ServiceNow 通过精调 Embedding 模型提升 RAG 的准确性

    ServiceNow 通过精调 Embedding 模型提升 RAG 的准确性

    Jan 10, 2025

    —

    in RAG

    ServiceNow 使用 RAG 技术解决什么问题 曾经简单的研究过 ServiceNow 这家公司的产品,了解到它主要是围绕 ITSM / 低代码领域做企业流程。…

  • RAG 里如何做 Query 优化

    RAG 里如何做 Query 优化

    Dec 29, 2024

    —

    in RAG

    RAG 技术的整体流程 RAG (Retrieval-Augmented Generation) 是用来给 LLM 注入特定的知识,解决 LLM 在回答事实…

  • Your Daily LLM & RAG Research Digest

    Your Daily LLM & RAG Research Digest

    Dec 24, 2024

    —

    in Hacker

    Introduction The rise of Large Language Models (LLMs), particularly in…

  • 海外 VPS 选购对比

    海外 VPS 选购对比

    Dec 10, 2024

    —

    in Hacker

    为什么要海外 VPS 如果你搞 SaaS 出海,做独立开发项目,或者搭建一个 WordPress 博客,不想折腾网站备案这些事情,那就要选择海外 VPS,部署在新加坡、日本、北美等地域,让你的目标用户的访问更顺畅。 或者就是想搭一个代理,用来绕过 ChatGPT…

  • 多模态的 RAG:工作流、评测框架和结果

    多模态的 RAG:工作流、评测框架和结果

    Nov 28, 2024

    —

    in RAG

    什么是多模态 RAG 真正的多模态 RAG 是指,检索环节支持多模态,生成环节也支持多模态,Multi-modal Retrieval & Multi-modal Generation。多模态(图、文)混排的输出比纯文本(包括Markdown 格式化)的用户体验好很多,图片本身易读、易理解,图片比文字更具象化。…

  • MinerU项目的研究分析

    MinerU项目的研究分析

    Nov 19, 2024

    —

    in Hacker

    MinerU产品体验 介绍 MinerU 可以把 PDF 转成 markdown/json 文件,支持提取 Table、Image、LaTex 公式,能保证…

  • Poppler: 超强的 PDF 转换和导出工具

    Poppler: 超强的 PDF 转换和导出工具

    Nov 7, 2024

    —

    in Hacker

    poppler 是一个用于 PDF 提取、转换、修改等用途的 lib 库,功能强大,速度飞快。 本文里使用 https://arxiv.org/abs/2411.03628 这篇 PDF…

  • 怎样做到 LLM Long-Context 越长 RAG 性能越好

    怎样做到 LLM Long-Context 越长 RAG 性能越好

    Oct 24, 2024

    —

    in RAG
    Long Context

    总结 这篇来自 Google DeepMind 的论文 “Inference Scaling for Long-Context Retrieval…

Next Page→

Heycc's blog

I blog about AI, product, develop

My Products

  • Daily LLM Papers
  • PDF Images Extractor

Social

  • X
  • LinkedIn