推出 1 位和三值 Bonsai Image 4B适用于本地设备的图像生成模型2026 年 5 月 26 日PrismML 发布了 Bonsai Image 4B这是一系列紧凑的图像生成模型旨在在从笔记本电脑到手机的本地硬件上进行高质量的扩散推理。模型版本Bonsai Image 4B 有两个版本1 位 Bonsai Image 4B 使用二进制 {-1, 1} 变压器权重并带有 FP16 分组缩放因子每个权重的有效位数为 1.125 位以最大压缩为目标适用于内存压力、带宽和部署占用空间为主要限制因素的场景三值 Bonsai Image 4B 使用 {-1, 0, 1} 变压器权重并带有 FP16 分组缩放因子每个权重的有效位数为 1.71 位额外的零状态使模型具有更强的表达灵活性在保持极其紧凑的同时提高了视觉质量和对提示的忠实度。新部署模式这一成果开启了图像生成的新部署模式输出能力出色、权重开放并且能够在以前这类模型无法运行的设备上进行实际的本地推理。Bonsai Image 4B 是其参数类别中首个可直接在 iPhone 上运行的图像模型。为本地生成而设计本地图像生成面临一个严格的限制模型必须能适配设备的内存预算。对于 4B 级别的图像模型扩散变压器是模型中最大的部分也是生成过程中反复运行的部分。每次去噪步骤都会再次调用变压器因此变压器的大小直接影响内存压力、带宽需求和本地推理速度。Bonsai Image 4B 基于 FLUX.2 Klein 4B 构建它保留了原有的架构但改变了变压器权重的表示方式。通过将这些权重转换为二进制和三值形式Bonsai 减小了对本地部署最为关键的图像管道部分。二进制层相对于全精度变压器权重大约缩减了 14 倍。一小部分对精度敏感的支持张量约 5%即投影层仍采用 FP16 格式因此最终的 1 位 Bonsai Image 4B 变压器大小为 0.93 GB相比 7.75 GB 的全精度 FLUX.2 Klein 4B 缩减了 8.3 倍。三值版本采用相同的结构。其三值层大约缩减了 10 倍最终的三值 Bonsai Image 4B 变压器大小为 1.21 GB相比全精度变压器缩减了 6.4 倍。它比 1 位模型稍大但额外的零状态提高了视觉质量和对提示的忠实度。包括压缩后的文本编码器和 FP16 VAE1 位 Bonsai Image 4B 在 Apple Silicon 上的部署负载为 3.42 GB三值 Bonsai Image 4B 为 3.88 GB。相比之下全精度的 FLUX.2 Klein 4B 需要 15.97 GB 的部署负载。由于在运行时文本编码器在提示编码后会被卸载因此平均内存使用量小于总负载。在生成 512x512 图像时二进制和三值模型的平均活动内存分别为 1.5 GB 和 1.96 GB而原始的 FLUX.2 Klein 4B 为 11.74 GB分别缩减了 7.8 倍和 6.0 倍。对于 1024x1024 图像二进制和三值模型的平均活动内存分别为 1.95 GB 和 2.38 GB而原始的 FLUX.2 Klein 4B 为 14.39 GB分别缩减了 7.4 倍和 6.0 倍。内存占用的减少改变了模型的运行范围。部署堆栈支持 Apple Silicon 的 iPhone、iPad 和 Mac 以及 CUDA GPU在苹果硬件上使用 MLX 低比特路径在 CUDA 上使用 Gemlite 低比特 GEMM 内核。在 iPhone 17 Pro Max 上全精度的 FLUX.2 Klein 4B 管道无法适配设备的内存预算而两种 Bonsai Image 变体都可以在设备上运行。实际上Bonsai Image 4B 在 iPhone 17 Pro Max 上生成 512x512 图像需要 9.4 秒在 Mac M4 Pro 上约需 6 秒。在 Mac M4 Pro 上Bonsai Image 4B 比原生全精度 MFLUX 管道快达 5.6 倍。性能基准测试只有当模型保持实用性时压缩才有意义。通过三个互补的基准测试对 Bonsai Image 4B 进行了评估用于对象组合和属性绑定的 GenEval、用于人类偏好和美学质量的 HPSv3 以及用于密集提示遵循和语义忠实度的 DPG - Bench。三值 Bonsai Image 4B 是注重质量的版本。其大小为 1.21 GB在 GenEval、HPSv3 和 DPG - Bench 测试中保留了 FLUX.2 Klein 4B 95% 的准确率同时将扩散变压器的占用空间缩减了 6.4 倍。1 位 Bonsai Image 4B 是注重占用空间的版本。它将扩散变压器的大小降至 1 GB 以下缩减了 8.3 倍同时在相同的三项评估中仍取得了不错的基准分数保留了 FLUX.2 Klein 4B 88% 的准确率。这两个版本共同推动了质量与占用空间的平衡。Bonsai Image 在使用现代 4B 级图像模型一小部分扩散变压器占用空间的情况下仍能与它们竞争。同时它在内存占用相近的情况下大幅超越了较小的模型。这与之前的 Bonsai 语言模型所实现的帕累托改进类似。Bonsai Image 将现代扩散变压器的性能带入了以前只有更小、能力更低的模型才能达到的内存范围。重要意义图像生成不仅是一个模型质量的问题也是一个部署问题。云 API 对于许多产品来说仍将是合适的选择。但仅依赖云的图像生成会带来一些产品限制每个提示都需要远程请求每次迭代都会产生额外的服务成本每次交互都会增加往返延迟。这很重要因为图像生成本质上是迭代式的。用户很少只满足于一张图像。他们会修改提示、比较输出、生成变体、舍弃不满意的结果并重新尝试。当每次尝试都需要在服务器端完成时创意循环就会变成用户需要谨慎控制并等待的过程。本地推理改变了这一现状。一旦模型能够适配设备图像生成就可以直接融入产品体验。它运行成本更低、迭代速度更快并且更易于在需要保护提示和生成资产隐私的环境中使用。Bonsai Image 4B 朝着这一部署模式迈出了一步在用户已有的硬件上更贴近用户地进行高质量的图像生成。可用性1 位和三值 Bonsai Image 4B 都将以开放权重和代码的形式发布并遵循 Apache 2.0 许可证。随着此次发布还推出了 Bonsai Studio这是一款用于在 iPhone 上直接试用 Bonsai Image 4B 的 iOS 应用。加入我们PrismML 由加州理工学院的研究团队发展而来并在科斯拉风险投资公司、Cerberus 和谷歌的支持下成立。多年来一直致力于解决该领域最具挑战性的问题之一在不牺牲神经网络推理能力的前提下对其进行压缩。如果想参与构建下一代最先进的 AI可访问招聘页面。资源白皮书、Hugging Face、WebGPU 演示、iPhone 版 Bonsai Studio、GitHub。相关资讯2026 年 3 月 31 日宣布推出 1 位 Bonsai 模型它将先进的智能带到人们实际生活和工作的设备上。2026 年 3 月 31 日PrismML 作为高性能 AI 模型的先驱正式亮相推出了全球首个商业可行的 1 位大语言模型该模型基于加州理工学院的开创性研究成果。资源白皮书、iPhone 版 Bonsai Studio。模型Hugging Face、WebGPU 演示、Bonsai Image 演示、GitHub。关注我们X、Discord、LinkedIn。