ollama v0.18.3 发布：VS Code 原生集成 + Agent 模式，本地 AI 开发体验全面革新

张

张建站

2026/4/26 15:22:02

10分钟阅读

ollama v0.18.3 发布：VS Code 原生集成 + Agent 模式，本地 AI 开发体验全面革新

一、版本总览Ollama v0.18.32026年3月26日正式上线2026年3月26日开源本地大模型管理工具Ollama正式发布v0.18.3版本这是Ollama在AI开发工具集成领域的一次里程碑式升级。本次更新核心聚焦VS Code深度原生集成与Agent模式能力开放两大核心功能同时完成多项底层优化与Bug修复进一步强化了本地大模型在开发场景中的实用性与稳定性。从版本更新数据来看本次v0.18.3版本由8位贡献者共同参与累计提交22次代码提交涉及83个文件修改覆盖从核心功能开发、文档更新到底层引擎优化的全流程是一次功能与稳定性并重的全面升级。二、核心功能一Ollama原生启动VS Code本地模型无缝融入开发环境2.1 功能核心一行命令打通Ollama与VS CodeOllama v0.18.3最重磅的更新是实现了Ollama直接启动VS Code的原生能力开发者无需额外配置复杂的插件或中间件仅需一行命令即可完成Ollama与VS Code的深度绑定让本地大模型成为VS Code开发环境的原生组成部分。启动命令极为简洁在终端中输入以下任意一条命令即可ollama launch vscode# 或ollama launch code执行命令后Ollama会自动完成与VS Code的连接配置无需手动修改VS Code设置或安装第三方扩展即可在VS Code中直接调用本地部署的所有Ollama模型。2.2 操作流程三步在VS Code中使用Ollama模型命令执行完成后开发者可通过以下三步在VS Code的Copilot Chat中无缝使用Ollama本地模型实现AI辅助编码打开Copilot Chat在VS Code中打开Copilot Chat界面macOS系统使用快捷键CtrlCmdIWindows/Linux系统使用快捷键CtrlAltI选择模型选择器在Copilot Chat的输入框上方找到并点击模型选择器Model Picker选择Ollama模型在模型选择器中点击Other models其他模型选项即可在列表中找到所有本地部署的Ollama模型选择后即可开始使用本地或云端模型进行编码辅助。这一流程彻底简化了本地大模型与VS Code的集成步骤此前开发者需手动安装Continue、Copilot Chat等扩展并配置模型地址而Ollama v0.18.3通过原生集成将这一过程压缩为一行命令三步操作大幅降低了本地AI开发的使用门槛。2.3 功能价值本地模型VS Code打造私有化AI开发环境Ollama原生启动VS Code的核心价值在于为开发者提供了私有化、离线化、可定制的AI开发环境数据安全所有代码交互与模型推理均在本地完成无需将代码上传至云端彻底解决企业与个人开发者的代码隐私顾虑离线可用无需依赖网络连接即可在无网环境下使用本地模型进行代码生成、调试与优化适配离线开发场景模型自由支持所有Ollama兼容的本地模型如Llama 3、Qwen、DeepSeek-Coder等开发者可根据需求选择轻量级或高性能模型无需受限于云端模型的选择范围无缝协同与VS Code原生功能深度融合支持代码补全、错误修复、文档生成等全场景开发辅助无需在多个工具间切换。三、核心功能二Agent模式上线Ollama化身VS Code智能开发助手3.1 Agent模式定义让Ollama具备自主执行开发任务的能力Ollama v0.18.3正式开放Agent模式这一功能让Ollama能够借助VS Code的Agent模式能力自主执行命令、编辑文件、迭代代码从单纯的“问答式AI助手”升级为“可行动的开发智能体”大幅提升AI在开发流程中的自动化能力。简单来说Agent模式下的Ollama不再局限于“你问我答”而是可以根据开发者的指令直接操作VS Code完成一系列开发任务例如运行测试、修复Bug、生成文档、修改代码等实现开发流程的自动化与智能化。3.2 实用指令Agent模式下的高频开发指令示例Agent模式支持开发者通过自然语言指令让Ollama自主完成复杂开发任务以下是本次更新中官方推荐的高频实用指令覆盖测试、文档、代码生成三大核心场景测试相关指令“Run the tests and fix any failures”运行测试并修复所有失败用例Ollama会自动运行项目测试定位失败原因直接修改代码修复问题“Generate unit tests for this file”为当前文件生成单元测试自动分析当前文件的代码逻辑生成覆盖核心功能的单元测试代码文档相关指令“Update the README with the new API changes”根据新的API变更更新README文档自动识别项目API的更新内容同步修改README文档确保文档与代码一致代码迭代指令支持“优化当前函数性能”“重构代码结构”“添加注释”等自定义指令Ollama会根据指令自主编辑代码文件完成迭代优化。3.3 功能优势Agent模式重构本地AI开发流程Agent模式的推出彻底改变了本地大模型在开发中的角色核心优势体现在三个方面任务自动化将开发者从重复、繁琐的开发任务中解放例如测试修复、文档更新、代码生成等大幅提升开发效率上下文感知基于VS Code的项目上下文Ollama可精准理解项目结构、代码逻辑与开发需求执行的操作更贴合实际开发场景全流程协同从代码编写、测试到文档维护Agent模式覆盖开发全流程实现AI与开发工具的深度协同打造“一站式”智能开发体验。四、其他核心更新底层优化集成增强全面提升Ollama稳定性除了VS Code集成与Agent模式两大核心功能Ollama v0.18.3还完成了多项底层优化与集成能力增强覆盖工具调用解析、第三方集成、引擎修复、功能完善等多个维度进一步夯实了Ollama的稳定性与兼容性。4.1 工具调用优化GLM解析器升级提升工具调用稳定性本次更新对GLM解析器进行了专项优化重点提升了模型工具调用Tool Calls的解析能力与稳定性。GLM解析器是Ollama处理模型工具调用请求的核心组件优化后可更精准地解析模型输出的工具调用指令减少解析错误与格式异常确保Agent模式下的命令执行、文件操作等功能稳定运行为Agent模式的落地提供了底层支撑。4.2 第三方集成增强OpenClaw集成优化完善网关检查逻辑Ollama v0.18.3对OpenClaw集成进行了深度优化重点改进了网关检查Gateway Checks的逻辑与稳定性。OpenClaw是Ollama的重要第三方集成组件用于实现模型的联网搜索、外部服务调用等能力本次优化后网关健康检查逻辑更健壮可适配不同网络环境与部署场景修复了无守护进程安装时的网关检查冗余问题减少不必要的系统资源消耗提升了OpenClaw与Ollama核心服务的协同效率确保联网能力稳定可用。4.3 底层引擎修复MLX Runner多项修复优化推理性能针对MLX RunnerOllama的核心推理引擎之一本次更新修复了多项关键问题同时优化了缓存机制与推理性能修复Slice(0, 0)返回异常修复了MLX Runner中Slice(0, 0)操作返回完整维度而非空维度的Bug确保张量操作的准确性KV缓存共享优化实现了KV缓存跨会话共享对于具有公共前缀的对话会话可复用已缓存的KV数据大幅降低重复推理的内存消耗与时间成本缓存管理增强支持纯Transformer缓存的部分匹配优化缓存命中率在缓存转储树中显示“上次使用时间”方便开发者监控缓存状态修复了双重取消固定double unpin导致的panic问题提升引擎稳定性格式支持扩展新增mxfp4、mxfp8、nvfp4等量化格式的导入支持适配更多量化模型提升本地推理的兼容性。4.4 功能完善与Bug修复覆盖桌面端、日志、CI等全场景本次更新还完成了多项功能完善与Bug修复覆盖桌面应用、日志系统、CI流程、交互界面等多个维度桌面应用修复修复了OLLAMA_HOST配置为未指定地址时桌面应用 stuck加载的问题提升桌面端兼容性日志系统优化新增调试请求日志开关支持开启详细的请求日志记录方便开发者排查问题修复了MLX子进程日志死锁问题确保日志输出稳定交互界面优化TUI终端交互界面的模型选择器新增左箭头返回导航功能提升终端操作的便捷性CI流程修复修复了Windows平台下CGO编译器错误确保CI/CD流程在Windows环境下稳定运行配置优化launch模块新增“模型未变更时跳过冗余配置写入”逻辑减少不必要的磁盘IO提升启动效率API修复修复了api/show模块中Copilot Chat的basename覆盖问题确保模型信息展示准确。4.5 文档更新完善集成指南覆盖OpenClaw、Claude Code等场景为配合新功能上线Ollama官方同步更新了文档内容重点完善了第三方集成与使用指南更新Claude Code相关文档新增Telegram集成指南扩展Claude模型的使用场景新增Nemoclaw集成文档完善OpenClaw生态的使用说明更新OpenClaw的Web搜索相关文档明确联网能力的使用方法与配置细节。五、版本更新明细按时间线梳理所有提交内容Ollama v0.18.3版本的代码提交覆盖2026年3月18日至3月25日以下按时间线完整梳理所有提交内容确保无遗漏5.1 3月18日提交文档更新更新Claude代码与OpenClaw的Web搜索相关内容配置优化cmd/launch模块新增“模型未变更时跳过冗余配置写入”逻辑MLX Runner修复修复Slice(0, 0)返回异常问题MLX Runner优化实现KV缓存跨会话共享公共前缀复用。5.2 3月19日提交桌面应用修复修复OLLAMA_HOST未指定时桌面应用加载卡住问题工具解析优化parsers模块新增健壮的XML工具修复功能提升工具调用稳定性。5.3 3月20日提交功能新增新增调试请求日志开启功能MLX修复修复子进程日志死锁问题MLX Runner修复修复done通道值被第一个接收者消费的问题OpenClaw优化launch模块新增“无守护进程安装时跳过OpenClaw网关健康检查”逻辑文档更新新增Nemoclaw集成文档。5.4 3月23日提交MLX更新同步更新MLX引擎至3月23日版本文档更新更新Claude Code文档新增Telegram集成指南。5.5 3月24日提交MLX Runner优化支持纯Transformer缓存的部分匹配MLX Runner优化缓存转储树中显示“上次使用时间”MLX Runner修复修复双重取消固定导致的panic问题格式支持新增mxfp4、mxfp8、nvfp4量化格式导入支持测试优化提升单个模型的测试能力CI修复修复Windows平台CGO编译器错误。5.6 3月25日提交TUI优化模型选择器新增左箭头返回导航功能核心功能开发实现ollama launch vscode核心功能API修复修复api/show模块中Copilot Chat的basename覆盖问题。六、总结Ollama v0.18.3本地AI开发的“效率革命”代码地址bgithub.xyz/ollama/ollamaOllama v0.18.3版本的发布标志着本地大模型在开发工具集成领域进入了全新阶段。本次更新通过VS Code原生集成与Agent模式开放两大核心功能彻底打通了本地大模型与主流开发编辑器的壁垒让私有化、离线化的AI开发成为现实同时底层引擎的全面优化、第三方集成的增强以及多项Bug修复进一步提升了Ollama的稳定性与实用性。

Typora与Mirage Flow的梦幻联动：打造智能Markdown写作体验

Typora与Mirage Flow的梦幻联动：打造智能Markdown写作体验如果你经常用Markdown写东西，不管是技术文档、学习笔记还是日常随笔，那你对Typora肯定不陌生。它那种所见即所得的清爽界面，让写作变得特别专注。但有时候，写…...

2026/4/25 15:54:31 阅读更多 →

AutoGen Studio入门指南：从零开始构建AI智能体应用

AutoGen Studio入门指南：从零开始构建AI智能体应用 1. AutoGen Studio简介 AutoGen Studio是一个低代码开发平台，专为构建和部署AI智能体应用而设计。它基于AutoGen AgentChat框架，提供了可视化界面来快速创建、配置和管理AI智能体。核心…...

2026/4/25 7:00:46 阅读更多 →

LFM2.5-1.2B-Thinking快速上手：Ollama部署，体验边缘设备AI推理

LFM2.5-1.2B-Thinking快速上手：Ollama部署，体验边缘设备AI推理 1. 认识LFM2.5-1.2B-Thinking模型 LFM2.5-1.2B-Thinking是一款专为边缘设备优化的文本生成模型，它让高性能AI推理不再局限于云端服务器。这个1.2B参数的模型在保持小巧体积的同…...

2026/4/24 4:22:37 阅读更多 →

如何理解临键锁Next-Key Lock_行锁与间隙锁的组合原理解析

临键锁锁定的是左开右闭区间，如对索引值20加锁即锁住(10,20]，包含记录20及前一索引间隙；仅作用于被扫描的索引范围，且在REPEATABLE READ下启用。临键锁到底锁了哪块数据？临键锁不是新锁类型，而是 Record Lo…...

2026/4/26 0:01:56 阅读更多 →

CUDA 13.3 RTX 4090实测报告：FP16混合精度算子性能断层分析（含37个主流PyTorch算子汇编级差异对比）

更多请点击： https://intelliparadigm.com 第一章：CUDA 13.3 RTX 4090混合精度算子性能断层分析总览 NVIDIA RTX 4090 搭载的 Ada Lovelace 架构在 CUDA 13.3 中首次全面启用第三代 Tensor Core 的 FP8 原生支持，使得混合精度计算路径&…...

2026/4/26 0:10:29 阅读更多 →

Vue3项目实战：手写Ant Design Vue a-table拖拽排序（绕过付费功能）

Vue3项目实战：基于Ant Design Vue的a-table手写拖拽排序方案去年接手一个从React迁移到Vue3的项目时，遇到了一个有趣的挑战。项目使用了Ant Design Vue作为UI组件库，在实现菜单管理列表的拖拽排序功能时，发现官方提供的a-table拖…...

2026/4/26 0:11:28 阅读更多 →

2026届最火的AI辅助写作平台实测分析

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在人工智能进行交互期间，指令存在冗余情形常常会致使输出出现偏差以及造成效率方…...

2026/4/26 0:15:26 阅读更多 →