关于 RAG 的十个核心问题

张

张建站

2026/6/21 13:49:04

10分钟阅读

RAG 是什么检索增强生成给大模型「开卷考试」让它的回答基于真实文档工作流程分索引阶段离线建库和查询阶段在线检索生成微调 vs RAG微调是「内化知识」RAG 是「外挂参考书」两者互补文档切割从固定大小到语义切割推荐先用递归字符切割起步Re-rank用 Cross-Encoder 对检索结果做精排准确率提升 30-50%Embedding从 Word2Vec 到 BERT 再到 BGE-M3技术不断演进向量数据库Milvus、Pinecone、Weaviate 等各有侧重按需选型多路召回向量检索 BM25 混合检索效果比单路好 10-30%效果量化用 RAGAS 等框架评估 Faithfulness、Relevance 等核心指标大模型幻觉RAG 是降低幻觉的核心手段但不能完全消除需要组合策略

SDMatte服务监控与告警体系搭建：保障生产环境稳定性

SDMatte服务监控与告警体系搭建：保障生产环境稳定性 1. 为什么需要监控与告警系统在线上服务运维过程中，最怕的就是"半夜被电话叫醒"。SDMatte作为图像处理的核心服务，一旦出现性能下降或故障，直接影响用户体验和业务…...

2026/6/21 13:45:58 阅读更多 →

SQL注入（1）

1.原理：用户将恶意SQL语句的参数拼接到动态SQL语句，后端没有进行校验，然后在数据库中执行。2.分类：联合查询注入报错注入宽字节注入二次注入DNSlog注入请求头注入3.（1)联合注入查询：union通过union拼接查询…...

2026/6/21 14:08:22 阅读更多 →

Blender3mfFormat插件深度解析：3D打印工作流中的关键技术实现与性能优化

Blender3mfFormat插件深度解析：3D打印工作流中的关键技术实现与性能优化【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 在3D打印行业蓬勃发展的今天&#xf…...

2026/6/15 20:32:14 阅读更多 →

终极网盘直链下载指南：八大平台高速下载完全解决方案

终极网盘直链下载指南：八大平台高速下载完全解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

2026/6/21 0:08:17 阅读更多 →

抖音无水印下载终极指南：专业级开源工具完全解析

抖音无水印下载终极指南：专业级开源工具完全解析【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...

2026/6/21 0:08:48 阅读更多 →

考研英语黄皮书pdf|考研英语黄皮书原文外教朗读|考研英语真题手译本电子版

考研英语黄皮书pdf|考研英语黄皮书原文外教朗读|考研英语真题手译本电子版资料全科都有考研英语黄皮书 PDFhttps://tool.nineya.com/s/1jpq3effr 【英语真题】1. The word "resilient" means（ ） A. able to recover quickly B. very fragile C…...

2026/6/21 0:14:48 阅读更多 →

中兴光猫权限解锁工具：zteOnu完整使用指南与教程

中兴光猫权限解锁工具：zteOnu完整使用指南与教程【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 中兴光猫权限解锁工具zteOnu是一款专门用于开启中兴光猫设备工厂模式的强大…...

2026/6/21 0:16:58 阅读更多 →