Heycc's blog – I blog about AI, product, develop

融合检索 & Rerank 在 RAG 中的效果评测

May 16, 2024

—

in RAG

RAG 的基本原理 RAG 的工作流程主要分为两个阶段： Embedding 的缺点 Embedding 的具象化理解可以是，用一组高维数据来表达一段文本的核心内容。如果这段文本非常长，或者包含的内容非常多样化，那么固定维度的 embedding 是很难表达文本的全面内容的。因此：…
AI编程的十字路口：资深开发者的兴奋、焦虑和故事

Oct 11, 2025

—

in Coding

最近，关于“Vibe Engineering”的讨论在 hacker new 论坛引发了大量讨论和共鸣。在 700 多条评论中，开发者们分享了他们使用AI编码工具（如Claude Code、GPT等）的亲身体验，观点鲜明深刻，故事情感真挚。这已经不止于一场技术辩论，更是一场关于职业身份、工作乐趣和行业未来的思考了。所以我很想整理分享出来，以下是讨论内容的焦点。是效率重要，还是可靠性重要？ 1.…
从 Kimi Deep Research 看 Manus：我们真的需要一个通用 AI Agent 吗？

Jul 10, 2025

—

in Uncategorized

背景近期，Kimi 上线了 “深度研究”（Deep Research）功能。我正好用它来解决一个实际的调研需求：AI Code Review 的工具调研。为了更全面的视角，我同步对比测试了 Gemini…
Gemini Deep Research 是怎样工作的

May 12, 2025

—

in Agent

Deep Research 是什么，为什么值得研究当我们要在不熟悉的领域研究一个话题时，离不开搜索引擎。传统搜索费时费力，即便是新兴AI搜索（如Perplexity），也多止于浅层问答，难以进行扩展性搜索和深度调研。为此，Deep Research 应运而生：它能将模糊的研究任务拆解细化，在海量网络信息中主动搜索、筛选、乃至反思迭代，最终呈现一份条理清晰、内容详实的研究报告，而非零散观点。 Deep Research 的核心在于其自主思考的智能体（Agent）形态。它能主动规划路径，执行多步探索，并在过程中回顾调整。更关键的是，其背后的模型（如 Gemini）支持高达上百万…
当 Vibe Coding 遭遇 Vibe Hiring: Perplexity 的一场实习生招聘风波

May 1, 2025

—

in Coding

这两天 Reddit 上一个吐槽 AI 招聘的帖子火了🔥 原帖的作者来自一家 AI 独角兽（后被指认是 Perplexity），作为招聘者在 Reddit…
Mac mini M4 vs. RTX 4090 vs. RTX 2080ti: 部署DeepSeek R1 的效果评测

Feb 21, 2025

—

in LLM

导语 Apple 最新版 M4 芯片上市后，大家对在 Mac M4 上本地部署 LLM 热情不减。M…
深度解密 | DeepSeek R1 + 编程神器 Cline 是如何做到全自动化编程的?

Feb 11, 2025

—

in Agent

【导语】当爆红的 DeepSeek R1 遇上编程界开挂神器 Cline (🏆OpenRouter工具榜TOP1)，是1+1>2的超神组合，还是可怕的 Token 黑洞？实测 Debug 全过程，揭秘…
ServiceNow 通过精调 Embedding 模型提升 RAG 的准确性

Jan 10, 2025

—

in RAG

ServiceNow 使用 RAG 技术解决什么问题曾经简单的研究过 ServiceNow 这家公司的产品，了解到它主要是围绕 ITSM / 低代码领域做企业流程。…
RAG 里如何做 Query 优化

Dec 29, 2024

—

in RAG

RAG 技术的整体流程 RAG (Retrieval-Augmented Generation) 是用来给 LLM 注入特定的知识，解决 LLM 在回答事实…
Your Daily LLM & RAG Research Digest

Dec 24, 2024

—

in Hacker

Introduction The rise of Large Language Models (LLMs), particularly in…
海外 VPS 选购对比

Dec 10, 2024

—

in Hacker

为什么要海外 VPS 如果你搞 SaaS 出海，做独立开发项目，或者搭建一个 WordPress 博客，不想折腾网站备案这些事情，那就要选择海外 VPS，部署在新加坡、日本、北美等地域，让你的目标用户的访问更顺畅。或者就是想搭一个代理，用来绕过 ChatGPT…