AI Harness 学习清单(AI生成)
1. 编程基本功先把这些能力练扎实Python学习内容基础语法函数、类、模块文件读写异常处理虚拟环境常用库requests、json、pathlib、os、logging为什么先学AI Harness 方向里Python 是最常用语言很多 LLM、Agent、评测、后端工具链都围绕它展开。2. 计算机基础数据结构与算法学习内容数组、链表、栈、队列、哈希表树、堆、图排序、查找DFS / BFS动态规划基础常见题型训练作用不是因为 Harness 本身天天考算法而是因为实习和校招几乎一定会考基础弱会直接卡住机会。计算机网络学习内容HTTP / HTTPSTCP / IP 基础请求响应模型REST APICookie、Session、TokenWebSocket 基础作用AI Harness 常常要接 API、工具系统、网页服务不懂网络会很难做真实项目。操作系统学习内容进程、线程并发和异步基础内存基础概念Linux 常用命令Shell 基础作用做 Agent 系统时经常要跑脚本、调服务、看日志、部署程序。数据库学习内容SQL 基础增删改查表设计索引基础PostgreSQL 或 MySQLRedis 基础概念作用很多 AI 应用都需要保存用户数据、任务状态、对话记录、检索索引。3. 软件工程能力这部分对你尤其重要因为 AI Harness 本质上很工程化。学习内容Git / GitHub分支管理单元测试调试能力日志系统配置管理面向对象设计设计模式基础代码规范API 设计Docker 基础持续集成基础重点理解怎么写可维护代码怎么定位 bug怎么让系统稳定运行怎么让别人接手你的项目4. Web 后端基础建议至少掌握一个 Python 后端框架。学习内容FastAPI 或 Flask路由请求参数响应结构中间件鉴权基础文件上传下载与数据库连接部署基础作用后面你做 RAG、Agent、工具调用系统通常都需要一个后端服务承接。5. 机器学习基础先学到“能理解不必卷科研”的程度。学习内容监督学习、无监督学习训练集、验证集、测试集过拟合、欠拟合常见模型概念特征、标签、损失函数模型评估指标sklearn 基本使用作用帮助你建立 AI 基本认识避免只会调用 API 但不懂原理边界。6. 深度学习基础学习内容神经网络基本概念前向传播、反向传播激活函数优化器CNN / RNN 是什么Transformer 的基本思想PyTorch 基础使用你要达到的目标知道大模型是怎么一类模型能看懂基础深度学习教程不要求你现在就能训练大模型7. LLM 基础这是进入 AI Harness 的核心前置。学习内容token 是什么context windowprompt 基础system prompt / user promptstructured outputfunction calling / tool callingembedding向量检索hallucination 幻觉问题temperature、top_p 等生成参数模型能力边界多轮对话上下文管理要搞清楚模型擅长什么模型不擅长什么为什么模型会答非所问为什么上下文管理比“提示词技巧”更重要8. RAG 基础这是最常见、最实用的 AI 工程模块之一。学习内容文档切分embedding向量数据库基本概念检索流程rerank 基础概念检索增强生成引用来源展示文档更新与索引维护检索质量评估你要会做的东西给一批文档建立知识库用户提问后检索相关片段结合检索结果生成答案给出引用来源9. Prompt Engineering 进阶这部分要学但不要只停在这。学习内容任务描述清晰化输出格式约束few-shot 示例chain-of-thought 的产品化替代思路角色指令设计约束条件注入错误恢复提示安全边界提示重点不是追求“神奇提示词”而是学会如何让模型在系统中更稳定。10. Agent 基础这是你真正靠近 Harness 的第一步。学习内容什么是 AgentAgent 与普通聊天机器人的区别工具调用单步任务与多步任务ReAct 思路Plan-and-Execute任务分解状态跟踪结果回写失败后的重试逻辑你要能理解Agent 不是“会说话的模型”而是“能完成任务的系统”。11. Workflow / Orchestration这是 AI Harness 很关键的一层。学习内容工作流编排状态机节点和边多步骤执行条件分支checkpointretrytimeouthuman-in-the-loop审批节点任务队列基础为什么重要因为真实 AI 系统不是一句话完成的而是多个步骤、多个工具、多个状态不断流转。12. Context Engineering这一层你一定要重视。学习内容如何组织上下文如何裁剪无关信息如何维护长期记忆如何做摘要压缩如何给不同任务注入不同上下文项目规则文件设计用户历史与任务状态管理prompt 与 context 的职责边界核心理解很多时候系统效果差不是模型太差而是上下文喂得不对。13. Tool Use 与系统集成AI Harness 很多价值都体现在“接工具”。学习内容调用外部 API数据库查询工具搜索工具文件读写工具网页抓取基础Shell / 代码执行工具的风险控制权限管理参数校验工具失败后的恢复目标让模型不只是“回答”而是能“办事”。14. Evaluation 评测体系这是很多学生容易忽略但企业非常重视的部分。学习内容什么是离线评测什么是在线评测基准样本集构造准确率、召回率、人工评分回归测试prompt / workflow 改动后的对比评估bad case 收集A/B 测试基础概念为什么重要Harness 工程不是把 demo 做出来而是知道系统是否真的变好了。15. Guardrails 与 AI 安全学习内容输出约束输入过滤敏感操作确认权限隔离Prompt Injection 基础认识工具调用白名单风险任务拦截审批机制数据泄露风险用户隐私保护基础意义Agent 一旦能调工具就不只是“乱回答”的问题而可能变成“乱执行”的问题。16. 可观测性与稳定性这是走向工程化的必修课。学习内容日志设计错误分类请求链路追踪基础latency 延迟分析成功率统计token 消耗统计成本监控异常报警重试与熔断机制目标出了问题你要能知道卡在哪一步是模型错了还是工具错了是上下文问题还是系统问题17. 部署与交付学习内容Docker 部署环境变量管理基础云服务概念Linux 服务器部署Nginx 基础认识HTTPS 基础简单 CI/CD版本管理灰度发布基础认识作用你做的 Agent 系统最后要能运行、能演示、能交付。18. 前端基础不用学太深但建议会一点。学习内容HTML / CSS / JavaScript 基础React 基础调后端 API聊天界面文件上传组件结果展示面板引用来源展示任务进度展示作用你做项目时前端能帮你把作品展示得更完整简历效果会明显更好。19. 项目实践顺序建议你按这个顺序做项目项目 1LLM 基础应用内容调用大模型 API做一个简单问答或文本生成工具支持基本参数设置记录日志项目 2RAG 知识库问答内容文档上传文档切分建索引检索问答显示引用来源项目 3带工具调用的 Agent内容接天气、日历、搜索、数据库等工具支持结构化输出失败重试简单权限控制项目 4多步骤工作流系统内容任务拆解状态流转节点编排人工审批checkpoint项目 5长任务 Harness Demo内容接收复杂任务自动分步执行写入中间状态自动评测出错恢复输出执行报告20. 你要重点熟悉的工具方向不要求一上来全会但要逐步接触基础工程工具Git / GitHubDockerPostmanLinuxPostgreSQLRedisPython / AI 生态FastAPIPyTorchtransformerspandasnumpyLLM / Agent 方向OpenAI APIAnthropic APILangChainLangGraphLlamaIndex向量数据库相关工具评测与观测方向日志系统tracing 工具eval 框架prompt/version 管理思路21. 学习时的优先级原则你在学习过程中优先顺序最好始终保持这样先工程基础再 LLM 基础再 RAG再 Agent再 Harness。不要一开始就扑到“多智能体”“自动写代码”“复杂编排”上。如果基础不稳后面会一直搭不起来。22. 你最后应该形成的能力画像如果你学得比较完整最终应该具备这些能力能写 Python 后端能调用 LLM API能做 RAG 系统能做工具调用 Agent能做多步骤工作流能做评测和日志能做基本安全约束能把项目部署出来能把系统问题定位清楚这时候你就已经比较接近AI 应用工程师Agent 工程师AI 平台工程师初级 Harness / AI Systems 工程方向23. 一个最实用的学习原则你学每一块内容时都问自己三个问题这块知识在真实 AI 系统里解决什么问题我能不能用一个小项目验证它我能不能把它写进简历讲清楚它的工程价值这样你学出来的东西不会停留在“看过”而会变成“会用”。