1分钟看图掌握核心要点有动图封面展示还有图 1 和图 2 供选择辅助理解全文欢迎在评论区留言表达倾向。前言现如今AI技术发展迅猛AI大语言模型能更好理解用户自然语言、识别意图并解答问题在购物APP上有不错表现。vivo探索了AI导购在官网购物咨询等场景的落地应用。用户在vivo官网购买商品主要有浏览首页或活动商品资源位、按品牌系列细分浏览选购页、在搜索页面直接搜索相关商品这几种路径缺少与用户互动推荐商品的形式而AI导购可与用户多轮对话为用户推荐商品或解答问题。AI导购广义上是综合智能体狭义上通过信息处理工程和大语言模型协同工作理解用户意图并回复问题。在该场景下AI导购主要有围绕用户描述推荐匹配手机、解答用户关于手机相关问题这两大能力。以推荐手机场景为例其简易工作流程为用户输入需求AI导购进行意图识别、理解输入内容、信息处理、输入大语言模型处理、结合输出内容获取商品和帖子接口信息最后结构化整理并流式输出呈现给用户。技术选型在介绍AI导购应用落地整体方案前先看技术选型。先对比大模型方案与传统数据库检索答案方案大模型方案处理流程和前面推荐手机场景的流程一致。2.1 大模型微调使用的技术栈是LLMFine - tuning Prompt - Engineering。LLM Fine - tuning是在预训练大语言模型基础上用特定领域数据进一步训练使模型适应特定任务或领域Prompt Engineering是精心设计和优化输入提示引导模型生成更准确输出。可参考的实现方案有StanfordAlpaca、LoRA微调。Stanford Alpaca是斯坦福大学基于LLaMA模型开发的指令微调模型LoRA是高效微调技术通过低秩矩阵分解减少微调参数量。该方案优势是具备较强泛化能力、能处理开放式问题、知识迁移能力强劣势是需要大量数据标注、成本高大数据集训练用于小问题应用资源浪费严重泛化能力与专业领域精度存在矛盾存在灾难性遗忘风险。2.2 专用模型构建技术路线是从0到1构建专业语料训练的问答模型技术栈是预训练大语言模型 专业手机语料。其劣势是开发成本极高、需要大量专业训练数据、模型泛化能力有限。2.3 Agent工作流技术路线是信息接口工程 Prompt工程 九问平台知识库 Function - Call RAG检索 大语言模型。信息接口工程调用商品信息接口、智能客服问答系统、相关社区帖子信息等Prompt工程围绕解决场景设计和优化提示词引导大语言模型输出准确并约束输出范围九问平台是快速搭建并使用智能体的平台提供创建知识库、函数回调、知识库RAG检索、Prompt优化、意图改写等实用能力。该方案优势是成本相对较低、泛化能力优秀、对训练数据要求较低、易于维护和迭代。2.4 技术选型决策依据选择Agent工作流方案理由是成本效益最优平衡了开发成本与效果表现技术风险可控不依赖大规模数据训练业务适配性强可快速响应业务需求变化维护成本低知识库更新相对简单。整体架构搭建AI导购方案要考虑能力边界明确其在vivo官网场景的定位是“小而精”。为AI导购设计了围绕用户上下文输入推荐适合手机、解答用户关于手机相关问题这两个核心能力进一步拆解有推荐vivo和iQOO品牌且在售的手机、回答相关手机问题、具备多轮对话能力、不展开回复不在能力范围内的问题并引导用户咨询等约束规则。3.1 AI导购分层结构确定能力边界后搭建解决方案AI导购分层结构由四层搭建。应用层是用户使用AI导购的场景提供入口用户可与AI导购自然语言交互以打字机流式输出大模型答案同时结构化输出推荐商品卡片信息和相关社区帖子信息策略层通过信息工程处理后进行策略分发处理用户意图判断问题所属能力范围调用相关接口构建数据信息集九问层是提供智能体创建、Prompt提示词组合、知识库搭建及RAG检索、对话信息等能力的综合性平台玄机层直接提供大模型调用计算能力、QPS分配及算力支撑对用户输入和大模型输出做严格自动化安全信息审核。3.2 AI导购交互流程图AI导购交互流程为用户输入问题大模型回答用户问题先通过意图改写结合多轮对话提取丢失主语并重新组织问题描述通过意图分类小模型判断用户真实咨询意图并分发分发到对应的策略处理如商品咨询、对比、推荐等在九问平台创建商品解答和手机推荐智能体处理输入安全性审核后调用大语言模型审核输出内容后输出到用户端。详细方案AI导购两个核心能力对应两个不同智能体处理判断用户问题所属类型有两种方式直接用大语言模型作为前置模型但响应时间长使用响应快的小模型如FastText模型响应快但需要训练。小模型处理短文本分类胜任具有训练成本低和性能优势减少对大模型依赖提高响应速度因此意图识别由小模型承载并针对场景单独训练。4.1 意图识别小模型整体模型训练流程包括合成数据和模型训练。合成数据过程为数据采集从用户过往在线客服场景咨询问题等多来源采集数据清洗对采集数据进行去重、缺失值处理、异常值检测等数据合成通过大模型工作流将清洗后数据进行模型理解生成符合要求的训练数据。数据合成有法则并给出实例借助大模型工作流为清洗后数据打标签。模型训练使用开源文本分类模型FastText其特点是基于词向量表示、支持多分类任务、快速训练和推理。训练代码及超参数有详细解释训练后的模型保存为model.bin文件可在CPU上运行推理速度快。模型最终通过容器化部署在CPU机器上推理速度和运行效果良好每次运行推理时间约10ms用户无感知。4.2 智能体设计用户问题经意图识别小模型识别后输出手机参数解读和手机商品推荐两个分类的概率值取较大值确定用户意图再送入对应智能体处理。4.2.1 手机参数解读智能体处理用户关于手机参数的解读理解问题如咨询“x300手机的电池容量是多少”要获取用户咨询的vivo或iQOO品牌手机、准确识别手机型号、理解用户咨询的问题。获取信息语料是在服务后台按品牌和系列维护机型列表补充详细语料库通过用户问题匹配机型和问题模块获取原始手机信息语料。Prompt提示词设计有角色定义、任务边界、输出格式、示例引导等原则提示词中“手机信息{{infos}}”由获取的手机信息语料填充。手机参数解读Bot输入是用户问题和匹配的手机信息内部有Prompt调优工程、结构化信息和智能客服官方问答系统最后送入大语言模型处理。4.2.2 手机商品推荐智能体围绕用户描述推荐匹配手机从用户描述中提取关键信息如注重摄像功能、预算、最新旗舰手机等推荐时尽量匹配这些点。Prompt提示词设计要让推荐手机更好匹配用户问题将推荐手机商品信息补充到列表中与Prompt组合送给大模型让大模型理解问题并推荐手机。提示词有角色、技能、注意事项等规定补充知识包含推荐手机列表信息和智能客服问答系统答案。手机商品推荐Bot任务是根据用户咨询内容匹配合适的vivo官网在售手机识别到非手机推荐相关内容优先根据智能客服回答再委婉提示身份定位拒绝回答。4.3 知识库及RAG搜索垂直专业知识库建设很有必要AI导购方案搭建了商品推荐知识库和商品评测知识库分别对应推荐智能体和商品参数解读智能体。知识库内容包含手机评测、参数、卖点、对比分析等维度每个文件内容尽量聚焦作为RAG检索向量单位参与相关性分值计算。RAG是Retrieval - AugmentedGeneration技术结合检索和生成阶段提高模型信息处理和回应质量。通过匹配用户问题在知识库中计算片段相似性并排序根据大语言模型上下文约束选择前几个片段作为内容参考送入大语言模型。4.4 结构化输出呈现给用户的结构化输出内容包含商品卡片信息、大模型输出内容和相关社区帖子信息集合。4.4.1 商品卡片手机商品卡片由商品图片、名称、配置版本、价格和用户评论等信息组成信息通过请求手机商品接口获取。在手机参数解读场景根据用户咨询手机名称和后台映射表获取商品spuId调用商品信息接口查询获取信息并插入大模型返回的event中在推荐手机场景等待大模型输出推荐手机名称后再请求商品接口将请求后的json数据封装插入大模型流式返回中。4.4.2 大语言模型输出内容大语言模型输出是打印机式流式输出用户端要兼容流式输出使用SSE接口请求框架要做端侧缓存队列按一定速率消费队列内容展现给用户考虑大语言模型拒绝回答等异常情况添加【已停止】标识考虑用户操作异常情况如咨询未返回或未结束时再次咨询。4.4.3 相关帖子信息围绕用户问题输出贴合的相关社区帖子帮助用户拓展信息面。相关帖子信息根据用户问题和大模型输出内容搜索选取前五个匹配度较高的帖子展示。效果评估大语言模型效果不可预测存在模型幻觉问题所以上线前要进行安全测试。5.1 安全测试准备1.6W条测试安全测试语录涉及伦理道德、低俗文化、不良引导等方面。安全测试用例有内容组成、大语言模型结果、标注风险、标注依据等。针对不适合体验问题阻断大语言模型回答提示用户退出ai手机导购转人工咨询。安全问题处理有模型控制、边界处理、审核兜底三个策略。5.2 业务结果较快的首字符响应速度能赢得用户青睐整体服务首字节内容返回控制在2.5s以内体验效果良好。AI导购版本全量后效果不错整体业务数据超出预期通过AB实验和大盘效果观测对业务GMV和解决率有正向贡献。总结与展望首次在vivo官网引入AI导购新业务形态从技术验证到方案架构打磨再到上线落地提升了技术能力业务数据的正向提升也验证了AI导购应用场景的价值是技术探索和业务数据提升的双赢局面。未来会进一步拓展AI导购能力边界扩充解决范围如配件相关问题、手机和配件关联、手机检测能力、售后服务能力等交互形态也会更丰富如引入语言朗读、数字人交互等以满足用户多样化需求。vivo官网引入AI导购能否在未来带来更多惊喜呢