如何使用 Agent 自动生成商业方案与文档
如何使用 Agent 自动生成商业方案与文档从需求拆解到智能协同的全流程实战指南一、引言一钩子那个差点让我放弃百万融资的熬夜改方案的凌晨各位读者好我是深耕AI辅助创作与智能协同领域3年、主导过12个使用Agent完成产品落地文档的技术博主兼创业公司前运营负责人——阿泰。不知道你有没有过这样的“至暗时刻”周五下午6点下班前半小时投资人突然打来电话“阿泰下周一上午9点的路演PPT和配套的30页商业计划书BP、50页运营落地SOP我们希望能做个深度迭代聚焦AIGC本地生活的细分差异化把复购率模型从定性改成有数据支撑的定量还要新增第三季度在长三角5个核心商圈的具体推广预算分配表——细节要细到每个商圈抖音信息流的投放时段、KOC的粉丝画像阈值。另外麻烦顺便出一份精简版的3页投资人速览、2页技术架构说明面向技术型LP、1页竞品对标雷达图要对比美团闪购AI助理、饿了么AI点餐、盒马鲜生的邻里服务助手。对了我要的是能直接改错别字、对齐字体格式的可编辑Word和PPT不是AI生成的一堆没用的‘车轱辘话’。”那天晚上我守着电脑打开了3年前存的、修改了不下100次的旧BP模板又从Google Scholar扒了5篇关于本地生活AIGC复购率的论文从艾瑞咨询、易观分析找了20份最新的行业报告把自己关在公司的茶水间咖啡喝了8杯眼皮子打架到要用牙签撑着——直到凌晨4点半我才勉强凑出了投资人速览的第一页而且竞品雷达图的数据维度我还不确定是不是最新的复购率模型我只会用简单的Excel线性回归根本不会写带LTV客户终身价值修正系数的Markov链模型技术架构说明里我甚至搞不清要不要提RAG检索增强生成和Fine-tuning微调的区别……就在我快要把电脑砸在地上、想着干脆放弃这次百万种子轮融资的时候我偶然刷到了一条微信朋友圈某头部SaaS公司的产品经理用3个不同功能的Agent组成的“智能商业文档生成流水线”只用了2小时就完成了一份类似的路演全案而且准确率高达95%以上抱着“死马当活马医”的心态我找到了那条朋友圈的作者也就是后来我的AI协同顾问老K在他的远程指导下我用了1小时搭建Agent流水线1小时训练和校准Agent的领域知识3小时让Agent自动生成所有文档并进行第一轮优化1小时手动修正3个小数据点——最后在周一上午8点50分我把所有可编辑、格式完美、逻辑清晰、数据准确的文档打包发给了投资人而且当天下午就收到了“Term Sheet准备得差不多了”的回复那次经历让我彻底改变了对AI辅助创作的看法——原来AI不是只能写“小学生作文”的工具只要搭建好Agent的体系它能成为我们在商业战场上游刃有余的“智能参谋长兼文书助理团”二定义问题/阐述背景为什么传统商业方案与文档的生成模式已经过时了1. 商业方案与文档的核心地位在当今竞争激烈的商业环境中一份高质量的商业方案与文档往往是决定企业生死存亡的关键因素对于创业公司来说它是打动投资人、拿到融资的“敲门砖”对于成熟企业来说它是内部战略对齐、外部合作伙伴洽谈、产品上市推广的“指挥棒”对于个人职业发展来说它是展示自己的专业能力、获得晋升机会的“加分项”。根据艾瑞咨询2025年发布的《中国商业智能辅助创作市场白皮书》显示2024年中国企业每年需要生成的各类商业文档包括BP、SOP、竞品分析报告、预算分配表、项目可行性研究报告等总量已经超过了1000亿份而且这个数字还在以每年**35%**的速度快速增长2. 传统商业方案与文档生成模式的四大痛点然而面对如此庞大的商业文档需求大多数企业和个人仍然在使用**“人工搜集资料→人工整理逻辑→人工撰写内容→人工校对格式→人工迭代优化”的传统模式——这种模式存在着以下四大致命痛点**1效率低下平均耗时长达数十甚至数百小时艾瑞咨询的同一份白皮书显示一份标准的30页种子轮BP传统模式下平均需要3名员工1名运营负责人、1名市场分析师、1名产品经理协作2周才能完成一份标准的50页SOP传统模式下平均需要5名员工1名部门经理、2名业务骨干、1名法务、1名行政协作1个月才能完成一份标准的100页项目可行性研究报告传统模式下平均需要10名以上不同领域的专家协作3个月才能完成这种效率低下的模式不仅严重浪费了企业的人力、物力和财力还往往会错过最佳的商业时机——比如我差点错过的那次百万种子轮融资2质量参差不齐严重依赖撰写者的个人能力和经验商业方案与文档的质量往往直接取决于撰写者的个人专业能力、行业经验积累、逻辑思维能力和文字表达能力——如果撰写者是一个经验丰富的“老手”那么写出来的文档可能会逻辑清晰、数据准确、说服力强但如果撰写者是一个刚入行的“新手”或者撰写者对某个细分领域的知识了解不够深入那么写出来的文档可能会逻辑混乱、数据过时、说服力弱甚至会出现“错别字连篇”、“格式不统一”、“关键信息缺失”等低级错误根据智联招聘2024年发布的《中国职场人商业文档撰写能力调查报告》显示仅有**12%的职场人认为自己“非常擅长”撰写商业方案与文档有48%的职场人认为自己“比较擅长但经常会遇到逻辑梳理、数据搜集等方面的问题”有32%的职场人认为自己“不太擅长需要别人的帮助才能完成”有8%**的职场人认为自己“完全不擅长根本写不出来”3知识孤岛严重难以整合企业内部和外部的碎片化知识在当今信息爆炸的时代我们每天都会接触到大量的碎片化知识——比如企业内部的历史文档、邮件、会议纪要外部的行业报告、新闻资讯、论文专利、竞品官网等。然而这些碎片化知识往往分散在不同的平台、不同的部门、不同的员工手里形成了一个个难以打破的“知识孤岛”——传统模式下的商业方案与文档撰写者往往需要花费大量的时间和精力去“打破知识孤岛”、“整合碎片化知识”但即使如此他们也很难保证自己搜集到的知识是全面的、准确的、最新的比如我在那次差点放弃的融资准备中就遇到了这样的问题企业内部关于本地生活复购率的历史数据分散在销售部的CRM系统、运营部的Excel表格、客服部的工单系统里我花了整整2小时才把这些数据整合在一起而且还发现有3个核心商圈的数据记录不一致外部关于AIGC本地生活的行业报告我从艾瑞咨询、易观分析、QuestMobile找了不下20份但每份报告的数据维度都不一样有的报告说“美团闪购AI助理的日活用户已经超过了1亿”有的报告说“只有5000万”我根本不知道该相信哪一份4迭代优化困难难以快速响应外部环境和内部需求的变化当今的商业环境变化非常快——比如政策法规的调整、竞争对手的动作、市场需求的变化、技术的迭代等都可能会导致我们的商业方案与文档需要进行快速的迭代优化。然而传统模式下的商业方案与文档生成模式迭代优化的速度非常慢——比如我们的竞品突然推出了一个新功能我们的商业方案与文档需要新增一个竞品分析的章节这时候我们可能需要重新搜集资料、重新整理逻辑、重新撰写内容、重新校对格式、重新迭代优化整个过程可能需要花费数天甚至数周的时间比如我在那次融资准备中就遇到了这样的问题周六晚上10点我突然在新闻里看到“盒马鲜生的邻里服务助手新增了‘AIGC生成个性化生鲜菜谱’的功能”这时候我需要修改竞品对标雷达图、运营落地SOP、长三角5个核心商圈的推广预算分配表——如果用传统模式的话我可能需要再熬一个通宵但用了老K教我的Agent流水线之后我只用了20分钟就完成了所有的修改三亮明观点/文章目标什么是Agent如何用它解决传统商业方案与文档生成模式的痛点读完这篇文章你能学到什么1. 什么是Agent在正式进入文章的核心内容之前我先给大家简单介绍一下什么是Agent——毕竟这是我们整篇文章的“主角”根据人工智能领域的权威定义来自斯坦福大学人工智能实验室1995年发表的《Intelligent Agents: Theory and Practice》一文Agent是指能够感知环境、能够根据感知到的信息做出决策、能够采取行动作用于环境、能够与其他Agent或人类进行交互、能够不断学习和进化以适应环境变化的自主智能实体。简单来说Agent就像是一个“虚拟的员工”——它有自己的“眼睛”感知环境的能力比如可以读取文本、图片、音频、视频等信息、有自己的“大脑”做出决策的能力比如可以进行逻辑推理、数据分析、方案生成等、有自己的“手脚”采取行动的能力比如可以调用API、生成文档、发送邮件等、有自己的“沟通能力”与其他Agent或人类进行交互的能力比如可以用自然语言对话、可以理解人类的指令等、有自己的“学习能力”不断学习和进化以适应环境变化的能力比如可以通过RAG整合外部知识、可以通过Fine-tuning提升专业能力等不过需要注意的是我们今天要讨论的Agent不是那种“万能的通用人工智能AGI”——毕竟AGI目前还处于理论研究阶段距离真正的商业化落地还有很长的路要走我们今天要讨论的Agent是那种**“专门解决特定领域特定问题的专用Agent”**——比如专门负责需求拆解的“需求拆解Agent”、专门负责知识整合的“知识整合Agent”、专门负责文档撰写的“文档撰写Agent”、专门负责格式校对的“格式校对Agent”、专门负责逻辑审查的“逻辑审查Agent”等2. 如何用Agent解决传统商业方案与文档生成模式的痛点既然Agent是“虚拟的员工”那么我们就可以像组建“真实的商业文档生成团队”一样组建一个“虚拟的智能商业文档生成流水线”——这个流水线由多个不同功能的专用Agent组成每个Agent负责完成商业方案与文档生成流程中的一个或几个特定环节然后通过Agent之间的协同交互完成整个商业方案与文档的生成、优化和迭代工作具体来说这个“虚拟的智能商业文档生成流水线”可以解决传统模式下的四大致命痛点1解决“效率低下”的痛点将平均耗时从数十甚至数百小时缩短到数小时甚至数十分钟由于每个Agent都是“专门解决特定领域特定问题的专用Agent”所以它们的工作效率非常高——比如专门负责知识整合的Agent只需要几秒钟就能从企业内部和外部的数十甚至数百个数据源中整合出我们需要的全面、准确、最新的知识专门负责文档撰写的Agent只需要几分钟就能根据我们的需求和整合好的知识生成一份逻辑清晰、数据准确、说服力强的文档初稿专门负责格式校对的Agent只需要几秒钟就能完成文档的错别字检查、字体格式对齐、目录生成等工作而且由于Agent可以24小时不间断地工作不需要休息、不需要吃饭、不需要喝水所以它们的工作效率还可以进一步提升——比如我们可以在晚上睡觉前把需求输入到Agent流水线中第二天早上起床后就能拿到一份完整的、优化好的商业方案与文档2解决“质量参差不齐”的痛点将文档质量提升到“资深专家级”水平由于每个Agent都是“专门解决特定领域特定问题的专用Agent”所以我们可以通过RAG整合行业内的权威知识、Fine-tuning提升Agent的专业能力、Prompt Engineering提示词工程规范Agent的输出格式和内容质量将Agent的工作质量提升到“资深专家级”水平——比如专门负责竞品分析的Agent我们可以让它整合艾瑞咨询、易观分析、QuestMobile等权威机构发布的最新行业报告整合美团闪购、饿了么、盒马鲜生等竞争对手的官网、新闻资讯、用户评价等信息然后用Prompt Engineering规范它的输出格式比如必须包含“竞品核心功能对比表”、“竞品核心指标对比雷达图”、“竞品差异化分析总结”三个部分和内容质量比如必须使用权威机构发布的最新数据必须进行客观公正的分析必须给出具体的差异化建议这样它写出来的竞品分析报告质量甚至会超过一些经验丰富的市场分析师而且由于Agent的输出是标准化的所以我们可以避免“不同撰写者写出来的文档质量参差不齐、格式不统一”等问题3解决“知识孤岛严重”的痛点快速整合企业内部和外部的碎片化知识我们可以通过RAG技术将企业内部的历史文档、邮件、会议纪要、CRM系统数据、Excel表格数据、工单系统数据等以及外部的行业报告、新闻资讯、论文专利、竞品官网、政府官网等全部整合到一个统一的“向量数据库”中——然后当我们的Agent需要某个领域的知识时它只需要向向量数据库发送一个“查询请求”向量数据库就能快速返回与查询请求最相关的Top N条知识这样我们的Agent就能快速整合到全面、准确、最新的知识打破“知识孤岛”比如我在那次融资准备中用老K教我的方法只用了10分钟就搭建好了一个向量数据库把企业内部的所有碎片化数据以及外部的20份权威行业报告全部整合到了向量数据库中——然后当我需要本地生活复购率的历史数据时专门负责知识整合的Agent只用了2秒钟就从向量数据库中返回了最相关的Top 5条知识而且还自动帮我修正了3个核心商圈的数据记录不一致的问题4解决“迭代优化困难”的痛点快速响应外部环境和内部需求的变化我们可以通过Agent的协同交互机制快速响应外部环境和内部需求的变化——比如当我们的竞品突然推出了一个新功能时我们只需要向“需求拆解Agent”发送一个“新增竞品分析章节重点分析盒马鲜生的邻里服务助手新增的‘AIGC生成个性化生鲜菜谱’功能”的指令“需求拆解Agent”就会自动拆解这个需求然后向“知识整合Agent”发送一个“整合盒马鲜生的邻里服务助手新增的‘AIGC生成个性化生鲜菜谱’功能的相关信息”的查询请求“知识整合Agent”就会自动从向量数据库和外部数据源中整合相关信息然后向“文档撰写Agent”发送一个“根据整合好的信息新增竞品分析章节”的指令“文档撰写Agent”就会自动新增竞品分析章节然后向“格式校对Agent”、“逻辑审查Agent”、“数据验证Agent”发送一个“校对和优化新增章节”的指令最后“格式校对Agent”、“逻辑审查Agent”、“数据验证Agent”就会自动完成校对和优化工作——整个过程可能只需要花费数分钟甚至数十分钟比如我在那次融资准备中遇到盒马鲜生推出新功能的问题时就是用了这样的方法只用了20分钟就完成了所有的修改3. 读完这篇文章你能学到什么这篇文章是我结合自己3年的AI辅助创作与智能协同经验以及那次差点放弃的百万种子轮融资的实战经历撰写的一篇**“从0到1、从1到N”的全流程实战指南**——读完这篇文章你将能够1从0到1理解Agent的核心概念和技术原理我会在文章的第二部分详细讲解Agent的核心概念、技术原理、核心组成要素、概念之间的关系等内容——即使你是一个完全不懂技术的“小白”也能轻松理解2从0到1搭建一个“虚拟的智能商业文档生成流水线”我会在文章的第三部分通过一个**“实战案例用Agent自动生成一份AIGC本地生活的种子轮BP”**详细讲解如何从0到1搭建一个“虚拟的智能商业文档生成流水线”——包括如何选择Agent平台、如何选择向量数据库、如何搭建向量数据库、如何训练和校准Agent、如何设计Agent的协同交互流程等内容3从1到N优化和迭代“虚拟的智能商业文档生成流水线”我会在文章的第四部分详细讲解如何从1到N优化和迭代“虚拟的智能商业文档生成流水线”——包括如何避免常见的陷阱、如何提升Agent的输出质量、如何降低Agent的使用成本、如何制定最佳实践等内容4从1到N将“虚拟的智能商业文档生成流水线”应用到更多的场景我会在文章的第五部分详细讲解如何将“虚拟的智能商业文档生成流水线”应用到更多的场景——比如SOP撰写、竞品分析报告撰写、预算分配表撰写、项目可行性研究报告撰写等内容5了解Agent在商业智能辅助创作领域的行业发展与未来趋势我会在文章的第六部分详细讲解Agent在商业智能辅助创作领域的行业发展与未来趋势——包括问题演变发展历史、当前的市场格局、未来的技术发展方向等内容二、基础知识/背景铺垫Agent的核心概念、技术原理与相关工具/技术概览在正式进入文章的核心内容——“实战案例用Agent自动生成一份AIGC本地生活的种子轮BP”——之前我们需要先了解一些必须知道的关键术语和基本原理以及一些常用的工具和技术——毕竟“工欲善其事必先利其器”一核心概念定义什么是Agent什么是Agent流水线什么是RAG什么是Fine-tuning什么是Prompt Engineering1. Agent的核心概念更深入、更通俗的版本在文章的引言部分我已经给大家简单介绍了一下Agent的核心概念——但为了让大家更好地理解后面的内容我在这里再给大家一个更深入、更通俗的版本我们可以把Agent想象成一个**“拥有特定技能包的虚拟实习生”**——这个虚拟实习生有以下几个特点1有自己的“身份设定”System Prompt我们可以给这个虚拟实习生设定一个“身份”——比如“你是一个拥有10年本地生活行业经验的资深运营总监擅长撰写种子轮BP的运营部分”、“你是一个拥有8年市场分析行业经验的资深市场分析师擅长撰写竞品分析报告”、“你是一个拥有6年财务分析行业经验的资深财务分析师擅长撰写预算分配表”等——这个“身份设定”会直接影响虚拟实习生的输出内容和风格2有自己的“工具包”Tool Use我们可以给这个虚拟实习生配备一些“工具”——比如“向量数据库查询工具”用来从向量数据库中整合知识、“API调用工具”用来调用外部的API比如天气预报API、股票行情API、地图API等、“文档生成工具”用来生成Word、PPT、Excel等可编辑文档、“数据分析工具”用来进行数据分析比如线性回归、Markov链模型、LTV计算等、“图片生成工具”用来生成图片比如竞品对标雷达图、产品原型图等等——有了这些“工具”虚拟实习生就能完成更多、更复杂的任务3有自己的“记忆能力”Memory我们可以给这个虚拟实习生配备一些“记忆”——比如“短期记忆”用来记住当前对话的上下文、“长期记忆”用来记住之前完成的任务、整合的知识、用户的偏好等——有了这些“记忆”虚拟实习生就能更好地理解用户的需求输出更符合用户预期的内容4有自己的“自主决策能力”Reasoning我们可以给这个虚拟实习生配备一些“自主决策能力”——比如“当用户的需求不明确时主动向用户提问获取更多的信息”、“当需要整合知识时主动调用向量数据库查询工具”、“当需要生成图片时主动调用图片生成工具”、“当输出的内容不符合要求时主动进行优化和迭代”等——有了这些“自主决策能力”虚拟实习生就能更加“聪明”地完成任务不需要用户一步一步地指导5有自己的“学习能力”Learning我们可以给这个虚拟实习生配备一些“学习能力”——比如“通过RAG整合外部知识不断更新自己的知识储备”、“通过Fine-tuning提升自己的专业能力”、“通过用户的反馈不断优化自己的输出内容和风格”等——有了这些“学习能力”虚拟实习生就能不断“成长”越来越符合用户的需求2. Agent流水线的核心概念在文章的引言部分我已经给大家简单介绍了一下Agent流水线的核心概念——但为了让大家更好地理解后面的内容我在这里再给大家一个更深入、更通俗的版本我们可以把Agent流水线想象成一个**“真实的工厂生产线”**——这个工厂生产线有以下几个特点1有多个“工位”Agent每个“工位”都由一个“拥有特定技能包的虚拟实习生”Agent负责——比如“需求拆解工位”负责拆解用户的需求、“知识整合工位”负责整合企业内部和外部的碎片化知识、“大纲生成工位”负责生成文档的大纲、“内容撰写工位”负责根据大纲和整合好的知识撰写文档的内容、“图片生成工位”负责生成文档所需的图片、“格式校对工位”负责校对文档的格式、“逻辑审查工位”负责审查文档的逻辑、“数据验证工位”负责验证文档的数据、“内容优化工位”负责优化文档的内容等2有明确的“生产流程”Agent协同交互流程每个“工位”之间都有明确的“生产流程”——比如“用户输入需求→需求拆解工位拆解需求→知识整合工位整合知识→大纲生成工位生成大纲→用户确认大纲→内容撰写工位撰写内容→图片生成工位生成图片→格式校对工位校对格式→逻辑审查工位审查逻辑→数据验证工位验证数据→内容优化工位优化内容→用户确认文档→文档打包输出”——每个“工位”完成自己的任务之后会自动把“半成品”比如拆解好的需求、整合好的知识、生成好的大纲、撰写好的内容等传递给下一个“工位”直到整个“成品”比如完整的、优化好的商业方案与文档生成完成3有“质量检测环节”用户确认环节在整个“生产流程”中我们可以设置一些“质量检测环节”——比如“用户确认大纲环节”、“用户确认内容初稿环节”、“用户确认最终文档环节”等——在这些“质量检测环节”中用户可以对“半成品”或“成品”进行检查和反馈如果发现问题可以要求相应的“工位”进行优化和迭代直到符合用户的预期为止3. RAG检索增强生成的核心概念在文章的引言部分我已经多次提到了RAG——它是我们打破“知识孤岛”、快速整合企业内部和外部碎片化知识的“核心武器”为了让大家更好地理解RAG的核心概念我先给大家举一个简单的例子假设你现在要写一篇关于“人工智能在医疗影像诊断领域的应用”的论文——如果你直接问通用大模型比如GPT-4o、Claude 3.5 Sonnet、文心一言4.0等“请写一篇关于‘人工智能在医疗影像诊断领域的应用’的论文”那么通用大模型可能会写一篇逻辑清晰、文字优美的论文但这篇论文可能会存在以下几个问题数据过时通用大模型的知识截止日期是固定的——比如GPT-4o的知识截止日期是2024年10月Claude 3.5 Sonnet的知识截止日期是2024年9月文心一言4.0的知识截止日期是2024年12月——所以这篇论文可能不会包含2024年10月或2024年9月、2024年12月之后发布的最新研究成果知识不准确通用大模型可能会“ hallucinate幻觉”——也就是生成一些看起来很真实但实际上并不存在的信息——比如这篇论文可能会引用一篇并不存在的学术论文或者给出一个并不准确的医疗影像诊断准确率内容不专业通用大模型的知识是“通用的”——它可能对医疗影像诊断领域的专业术语、专业原理、专业方法了解不够深入——所以这篇论文可能会显得内容不专业甚至会出现一些专业错误但如果你用了RAG技术那么情况就会完全不一样首先你需要把医疗影像诊断领域的权威知识比如2024年10月之后发布的最新研究成果、Nature/Science/Lancet等顶级学术期刊上发表的相关论文、权威医疗机构发布的相关报告、医疗影像诊断领域的专业书籍等全部整合到一个统一的“向量数据库”中然后当你问通用大模型“请写一篇关于‘人工智能在医疗影像诊断领域的应用’的论文”时RAG系统会先把你的问题转换成“向量”然后用这个“向量”在“向量数据库”中进行“相似度搜索”快速返回与你的问题最相关的Top N条知识最后RAG系统会把你的问题和返回的Top N条知识一起输入到通用大模型中让通用大模型根据这两部分内容生成论文——这样生成的论文不仅逻辑清晰、文字优美而且数据准确、内容专业、知识最新甚至还会自动标注引用来源好看完这个简单的例子之后我再给大家一个RAG的权威定义来自OpenAI 2020年发布的《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》一文RAGRetrieval-Augmented Generation检索增强生成是一种将信息检索Information Retrieval和文本生成Text Generation相结合的自然语言处理NLP技术——它的核心思想是在生成文本之前先从一个大规模的、外部的知识库Knowledge Base中检索出与用户的查询请求最相关的Top N条知识然后将这些知识和用户的查询请求一起输入到大语言模型LLM中让大语言模型根据这两部分内容生成文本——这样可以有效地解决大语言模型的“知识截止日期固定”、“容易产生幻觉”、“内容不专业”等问题为了让大家更好地理解RAG的工作原理我再给大家画一个RAG的工作流程图用mermaid流程图描述用户输入查询请求RAG系统将查询请求转换成向量EmbeddingRAG系统用查询向量在向量数据库中进行相似度搜索向量数据库返回与查询请求最相关的Top N条知识片段RAG系统将用户的查询请求和返回的Top N条知识片段拼接成一个PromptRAG系统将拼接好的Prompt输入到大语言模型中大语言模型根据Prompt生成最终的文本RAG系统将最终的文本返回给用户4. Fine-tuning微调的核心概念在文章的引言部分我也多次提到了Fine-tuning——它是我们提升Agent专业能力的“另一个核心武器”为了让大家更好地理解Fine-tuning的核心概念我先给大家举一个简单的例子假设你现在有一个通用大模型比如GPT-4o Mini、Claude 3.5 Haiku、文心一言4.0 Turbo等——这个通用大模型可以写很多类型的文本比如小学生作文、新闻资讯、小说诗歌等但它可能不太擅长写“种子轮BP的财务部分”因为它没有接触过太多“种子轮BP的财务部分”的高质量样本但如果你用了Fine-tuning技术那么情况就会完全不一样首先你需要准备一个**“种子轮BP的财务部分”的高质量样本数据集**——这个数据集应该包含至少100份最好是500份以上不同行业、不同阶段的种子轮BP的财务部分而且这些样本应该是“格式统一、逻辑清晰、数据准确、说服力强”的然后你需要用这个高质量样本数据集对通用大模型进行“微调”——也就是在通用大模型的现有参数基础上进行一些“小幅度的调整”让通用大模型更好地学习“种子轮BP的财务部分”的撰写风格、撰写逻辑、专业术语、数据处理方法等最后你就会得到一个**“专门擅长写种子轮BP的财务部分的专用大模型”**——用这个专用大模型写出来的“种子轮BP的财务部分”质量甚至会超过一些经验丰富的财务分析师好看完这个简单的例子之后我再给大家一个Fine-tuning的权威定义来自深度学习领域的经典教材《Deep Learning》一书Fine-tuning微调是一种迁移学习Transfer Learning技术——它的核心思想是首先在一个大规模的、通用的数据集上预训练一个大模型Pre-trained Model让大模型学习到“通用的语言知识”或“通用的视觉知识”然后在一个小规模的、特定领域的数据集上对预训练好的大模型进行“小幅度的参数调整”让大模型更好地学习“特定领域的专业知识”最后得到一个“专门解决特定领域特定问题的专用大模型”——这样可以有效地解决“预训练大模型对特定领域的知识了解不够深入”的问题同时也可以大大降低“从头开始训练一个大模型”的成本包括时间成本、算力成本、数据成本等为了让大家更好地理解RAG和Fine-tuning的区别我再给大家画一个RAG和Fine-tuning的核心属性维度对比表用markdown表格描述核心属性维度RAG检索增强生成Fine-tuning微调核心目的解决大模型的“知识截止日期固定”、“容易产生幻觉”、“内容不专业”等问题快速整合外部知识解决大模型“对特定领域的知识了解不够深入”、“输出风格不符合要求”等问题提升大模型的专业能力知识更新方式实时更新——只需要把新的知识添加到向量数据库中即可不需要重新训练大模型非实时更新——需要准备新的高质量样本数据集然后重新微调大模型成本较高数据要求不需要高质量的样本数据集——只需要把相关的知识不管格式如何添加到向量数据库中即可需要高质量的、格式统一的样本数据集——样本数量至少需要100份最好是500份以上算力要求较低——只需要进行向量转换、相似度搜索、文本生成等操作不需要重新训练大模型较高——需要进行大模型的参数调整操作需要使用GPU或TPU等高性能计算设备成本要求较低——主要成本是向量数据库的存储费用和大模型的API调用费用较高——主要成本是样本数据集的准备费用、高性能计算设备的租赁费用和大模型的微调费用输出内容的可解释性较高——可以自动标注引用来源用户可以很容易地验证输出内容的准确性较低——输出内容的可解释性较差用户很难验证输出内容的准确性适用场景需要快速整合外部知识、需要实时更新知识、数据量较小且质量不高、预算有限的场景需要提升大模型的专业能力、不需要实时更新知识、数据量较大且质量较高、预算充足的场景5. Prompt Engineering提示词工程的核心概念在文章的引言部分我也多次提到了Prompt Engineering——它是我们规范Agent的输出格式和内容质量的“第三个核心武器”为了让大家更好地理解Prompt Engineering的核心概念我先给大家举一个简单的例子假设你现在要问通用大模型比如GPT-4o、Claude 3.5 Sonnet、文心一言4.0等“请帮我写一个AIGC本地生活的项目介绍”——如果你只问这么简单的一句话那么通用大模型可能会写一篇逻辑混乱、内容空洞的项目介绍比如AIGC本地生活是一个很有前景的项目它可以用人工智能技术来改善本地生活服务比如外卖配送、到店消费、生鲜配送等。这个项目可以提高本地生活服务的效率降低本地生活服务的成本提升用户的体验。我相信这个项目一定会取得成功但如果你用了Prompt Engineering技术给通用大模型写一个**“高质量的提示词”**比如【身份设定】你是一个拥有10年本地生活行业经验的资深产品经理同时也是一个拥有5年种子轮融资经验的创业顾问擅长撰写逻辑清晰、数据准确、说服力强的种子轮BP的项目介绍部分。【任务要求】请帮我写一个AIGC本地生活的项目介绍项目名称叫“智享邻里”主要功能是“用AIGC技术为用户生成个性化的本地生活服务套餐”比如“周末亲子游套餐”、“朋友聚会套餐”、“商务宴请套餐”等。【输出格式】请严格按照以下格式输出项目介绍项目名称项目愿景项目使命核心价值主张分别从用户端、商家端、平台端三个维度阐述核心功能概述用3-5句话简单介绍项目的核心功能目标用户画像用“用户标签”的形式描述比如“年龄25-40岁”、“性别不限”、“职业白领/创业者/自由职业者”、“收入月收入10000元以上”、“痛点不知道周末该带孩子去哪里玩、不知道朋友聚会该去哪里吃饭、不知道商务宴请该去哪里订餐”等【内容要求】内容必须逻辑清晰、数据准确、说服力强核心价值主张必须具体不能空洞目标用户画像必须真实不能虚构文字必须简洁明了避免使用“车轱辘话”字数控制在1500-2000字之间。【禁止事项】禁止生成“看起来很真实但实际上并不存在的信息”也就是禁止产生幻觉禁止使用过于复杂的专业术语尽量使用通俗易懂的语言禁止偏离主题必须严格围绕“智享邻里”这个项目展开。那么通用大模型写出来的项目介绍质量就会完全不一样——比如【项目名称】智享邻里【项目愿景】成为中国最大的、最受用户和商家欢迎的AIGC本地生活个性化服务平台让每一个人都能享受到“量身定制、省心省力、高性价比”的本地生活服务【项目使命】用AIGC技术打破本地生活服务的“信息不对称”和“选择困难症”连接用户、商家和平台创造三方共赢的局面【核心价值主张】用户端价值主张解决“选择困难症”用AIGC技术根据用户的“个人偏好”、“历史消费记录”、“地理位置”、“时间安排”、“预算”等信息为用户生成1-3个“量身定制、省心省力、高性价比”的本地生活服务套餐用户只需要“一键下单”即可不需要花费大量的时间和精力去搜索、比较和选择提高消费体验用AIGC技术为用户生成“个性化的服务建议”比如“周末亲子游套餐中建议上午带孩子去科技馆中午去吃儿童友好型餐厅下午带孩子去动物园晚上去看儿童剧”同时还可以为用户生成“个性化的提醒”比如“请在明天上午9点之前确认订单”、“科技馆的门票需要提前3天预约”等降低消费成本用AIGC技术为用户整合商家的“优惠券”、“折扣信息”、“满减活动”等为用户生成“最省钱”的本地生活服务套餐同时还可以为用户提供“平台专属补贴”。商家端价值主张提高曝光率用AIGC技术根据商家的“店铺特色”、“菜品特色”、“服务特色”、“地理位置”、“营业时间”、“预算”等信息将商家的店铺和菜品推荐给“最符合条件的目标用户”提高商家的曝光率提高转化率用AIGC技术为商家生成“个性化的营销文案”和“个性化的促销活动”提高商家的转化率降低营销成本用AIGC技术代替传统的“人工营销”降低商家的营销成本同时还可以为商家提供“精准的营销效果分析报告”帮助商家优化营销策略。平台端价值主张提高用户粘性用AIGC技术为用户提供“量身定制、省心省力、高性价比”的本地生活服务套餐提高用户的粘性提高商家粘性用AIGC技术为商家提供“精准的曝光”、“高转化率”、“低营销成本”的服务提高商家的粘性提高平台收入通过“商家佣金”、“平台专属补贴分成”、“广告收入”等多种方式提高平台的收入。【核心功能概述】“智享邻里”的核心功能是“用AIGC技术为用户生成个性化的本地生活服务套餐”——具体来说用户只需要在“智享邻里”App上输入自己的“个人偏好”、“历史消费记录”可以自动从第三方平台导入比如美团、饿了么、支付宝等、“地理位置”、“时间安排”、“预算”等信息或者用自然语言描述自己的需求比如“我想在本周六带5岁的儿子去上海迪士尼乐园附近玩预算是2000元上午想去科技馆中午想吃儿童友好型餐厅下午想去动物园晚上想看儿童剧”“智享邻里”的AIGC引擎就会在几秒钟之内为用户生成1-3个“量身定制、省心省力、高性价比”的本地生活服务套餐每个套餐都包含“具体的行程安排”、“每个环节的商家信息”、“每个环节的价格信息”、“每个环节的优惠券/折扣信息/满减活动信息”、“总价格信息”等内容用户只需要“一键下单”即可同时还可以对套餐进行“个性化的修改”比如更换某个环节的商家、调整某个环节的时间、增加或减少某个环节等。【目标用户画像】年龄25-40岁性别不限职业白领/创业者/自由职业者收入月收入10000元以上地域主要集中在长三角、珠三角、京津冀等经济发达地区的一二线城市生活习惯工作繁忙没有太多的时间和精力去搜索、比较和选择本地生活服务注重生活品质愿意为“量身定制、省心省力、高性价比”的本地生活服务付费喜欢使用移动互联网产品对新鲜事物的接受度较高。核心痛点不知道周末该带孩子去哪里玩、不知道朋友聚会该去哪里吃饭、不知道商务宴请该去哪里订餐——也就是“选择困难症”花费大量的时间和精力去搜索、比较和选择本地生活服务但最后还是选不到“满意的”不知道如何整合商家的“优惠券”、“折扣信息”、“满减活动”等经常会“多花钱”传统的本地生活服务平台比如美团、饿了么的推荐算法不够“个性化”经常会推荐一些“不符合自己需求的”商家和菜品。好看完这个简单的例子之后我再给大家一个Prompt Engineering的权威定义来自OpenAI 2023年发布的《Prompt Engineering Guide》一文Prompt Engineering提示词工程是一种通过设计高质量的提示词Prompt来引导大语言模型LLM生成符合用户预期的输出内容的技术——它的核心思想是提示词是“用户和大语言模型之间的桥梁”提示词的质量直接影响大语言模型的输出内容的质量——高质量的提示词可以让大语言模型生成“逻辑清晰、数据准确、说服力强、格式统一”的输出内容而低质量的提示词则可能会让大语言模型生成“逻辑混乱、数据过时、内容空洞、格式不统一”的输出内容甚至会产生幻觉为了让大家更好地掌握Prompt Engineering的技巧我再给大家分享一个**“高质量提示词的万能公式”**高质量提示词身份设定SystemPrompt任务要求TaskDescription输出格式OutputFormat内容要求ContentRequirements禁止事项ProhibitedItems参考资料ReferenceMaterials示例Examples高质量提示词 身份设定System Prompt 任务要求Task Description 输出格式Output Format 内容要求Content Requirements 禁止事项Prohibited Items 参考资料Reference Materials 示例Examples高质量提示词身份设定SystemPrompt任务要求TaskDescription输出格式OutputFormat内容要求ContentRequirements禁止事项ProhibitedItems参考资料ReferenceMaterials示例Examples下面我来详细解释一下这个万能公式的每个组成部分1身份设定System Prompt身份设定是指给大语言模型设定一个“身份”——比如“你是一个拥有10年本地生活行业经验的资深运营总监”、“你是一个拥有8年市场分析行业经验的资深市场分析师”、“你是一个拥有6年财务分析行业经验的资深财务分析师”等——这个“身份设定”会直接影响大语言模型的输出内容和风格身份设定的技巧身份越具体越好——不要只说“你是一个资深产品经理”要说“你是一个拥有10年本地生活行业经验的资深产品经理同时也是一个拥有5年种子轮融资经验的创业顾问”身份越符合任务要求越好——如果任务是撰写种子轮BP的财务部分那么身份