RAG技术 Claude Code 中 RAG 落地的技术实践

张

张建站

2026/6/23 5:31:51

10分钟阅读

Claude Code 中 RAG 落地的技术实践声明：📝 作者：甜城瑞庄的核桃（ZMJ）原创学习笔记，欢迎分享，但请保留作者信息及原文链接哦～1. RAG 应用概述1.1 什么是 RAG？RAG的全称是Retrieval-Augmented Generation，中文叫检索增强生成。它是一种结合了"信息检索"和"文本生成"的人工智能技术架构。简单理解：让大语言模型在回答问题前，先"查资料"，再根据查到的资料来回答。1.2 为什么需要 RAG？普通的大语言模型（如 ChatGPT）就像一个只学过教科书的学生，知识只截止到训练数据的时间点。当问到最新信息或专业领域细节时，它可能会：编造答案（产生"幻觉"）回答"我不知道"给出过时或通用的信息RAG 就是为了解决这些问题而出现的。1.3 RAG 是怎么工作的？（三步走）想象一个开卷考试：检索（查资料）当你问一个问题，RAG 系统会立刻去一个"知识库"（比如公司内部文档、最新的网页、产品手册）里搜索，找出与问题最相关的几个片段。增强（组合信息）系统会把"你问的问题"和"搜到的相关片段"打包在一起，形成一个新的、内容更丰富的提示词。生成（回答问题）大语言模型拿到这个提示词后，只根据提供的资料来组织语言、生成答案。这样答案就既有依据，又自然通顺。1.4 一个形象的比喻传统大模型= 一个记忆力超强但不看书的闭卷考生。你问他历史事件，他只能凭记忆答，记错或没学过就会瞎说。RAG 应用= 一个允许带着参考书进考场的考生。你问什么，他立刻去翻书（检索），找到相关段落，然后用自己的话概括出来。答案有书为证，更可靠、更新。1.5 RAG 的核心优势知识更新快：知识库变了，答案就变了，无需重新训练模型。减少幻觉：基于检索到的证据回答，极大降低了胡编乱造的可能。可溯源：可以展示答案来自哪份文档，让你去核实。利用私有知识：企业可以把内部手册、合同、邮件建成知识库，让 AI 成为内部专家，而数据不离开公司。成本低：相比微调大模型，RAG 更便宜、更灵活。1.6 典型的 RAG 应用场景智能客服：根据最新产品手册回答用户问题（例如：“我手机连不上 Wi-Fi 怎么办？”）。企业知识库问答：问公司内部政策、流程、历史项目文档。AI 研究助手：帮你从海量论文中提取相关信息来回答特定问题。实时信息助手：结合搜索引擎，让 AI 查询今天的新闻、股价、天气。法律/医疗咨询：根据给定的法律条文或病历资料，提供更严谨的建议。1.7 与"微调"的区别微调：让模型学习新知识，改变其"思维方式"，适合长期、通用的风格或任务改变。RAG：让模型查询知识库，提供最新、具体的"事实"，适合动态、需要溯源的场景。1.8 总结RAG 应用 = 大语言模型 + 外部知识检索它让 AI 从一个"依赖记忆的聊天机器人"，进化成“会查阅资料的智能助手”，是目前解决大模型时效性差、容易产生幻觉和无法利用私有数据等核心痛点的主流技术方案。2. Claude Code 的 RAG 实践：官方智能体检索 vs 社区集成Anthropic 官方在 Claude Code 中并未采用传统 RAG 架构，而是创新性地实现了智能体检索（Agentic Search）。同时，社区通过 MCP（Model Context Protocol）和 Skills 机制，为 Claude Code 扩展了完整的传统 RAG 能力。2.1 官方方案：智能体检索（Agentic Search）2.1.1 核心机制Claude Code 基于超大上下文窗口（支持百万级 Token）和提示缓存技术，让 AI 模型自主调用grep、glob、ls、read等基础工具，进行多轮、迭代式的信息查找。整个过程由模型动态决策，类似人类开发者使用命令行探索代码库。2.1.2 四层上下文注入架构Claude Code 通过以下四层渐进式加载信息，避免撑爆上下文窗口：层级名称内容/

从K210到舵机：一个电赛声源定位系统的实战开发笔记

1. 从零搭建声源定位系统的硬件选型第一次接触电赛声源定位题目时，我和队友们花了整整三天时间在硬件方案论证上。市面上常见的方案主要有三种：STM32独立麦克风模块、K210官方圆形麦克风阵列、K210自制线性阵列。我们最终选择了第三种方案，这…...

2026/5/10 23:05:28 阅读更多 →

NumPy中使用省略号进行切片的实现示例

NumPy中的省略号（...）用于简化多维数组的切片操作，表示“所有未指定的轴”。当处理高维数组时，可以避免显式写出多个连续的冒号（:）。语法规则省略号的使用规则如下：... 会自动扩展为多个 :&…...

2026/5/12 23:46:03 阅读更多 →

从跟随到驱动：共集、共基与复合管放大电路的场景化解析与选型指南

1. 共集放大电路：信号跟随的艺术射极跟随器这个称呼真是再贴切不过了，我第一次用它做传感器信号缓冲时就惊叹于它的"忠实度"。想象一下你在用麦克风录音时，前级电路就像个害羞的歌手，需要个"传声筒"把声音原…...

2026/6/21 23:49:18 阅读更多 →

终极网盘直链下载指南：八大平台高速下载完全解决方案

终极网盘直链下载指南：八大平台高速下载完全解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

2026/6/22 11:26:33 阅读更多 →

抖音无水印下载终极指南：专业级开源工具完全解析

抖音无水印下载终极指南：专业级开源工具完全解析【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...

2026/6/23 4:09:51 阅读更多 →

考研英语黄皮书pdf|考研英语黄皮书原文外教朗读|考研英语真题手译本电子版

考研英语黄皮书pdf|考研英语黄皮书原文外教朗读|考研英语真题手译本电子版资料全科都有考研英语黄皮书 PDFhttps://tool.nineya.com/s/1jpq3effr 【英语真题】1. The word "resilient" means（ ） A. able to recover quickly B. very fragile C…...

2026/6/22 16:15:36 阅读更多 →

中兴光猫权限解锁工具：zteOnu完整使用指南与教程

中兴光猫权限解锁工具：zteOnu完整使用指南与教程【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 中兴光猫权限解锁工具zteOnu是一款专门用于开启中兴光猫设备工厂模式的强大…...

2026/6/23 4:09:31 阅读更多 →