比肩Z-Image！手机上实时图像生成、编辑模型！字节

张

张建站

2026/5/8 16:51:04

10分钟阅读

真没想到图像生成进化到这种程度了参数仅有 0.39B不需要云不需要电脑 GPU手机上就能实时生成的顶级图像生成、编辑模型来了。这么好的效果0.39B时时生成还能编辑你敢相信吗文本到图像直接生成动动嘴文本直接编辑这就是字节刚刚开源的 DreamLite。它是一个紧凑的统一设备扩散模型0.39B一个模型支持生成和文本引导的图像编辑。DreamLite 基于修剪的移动 U-Net 骨干上并通过上下文空间连接在潜空间中统一条件。为稳定该紧凑模型的训练团队引入了任务渐进式联合预训练策略依次针对 T2I、编辑和联合任务。使用 Qwen3-VL 作为文本嵌入模型。继 SFT 和 RL 之后通过步进蒸馏step distillation实现了四步推理。在 iPhone17 pro 上4 位 Qwen VLfp16 的 Tiny VAE 加上 UNet 主干能在约 3 秒内生成或编辑 1024 × 1024 图像。这是世界首个统一的设备端模型支持文本到图像生成和基于文本的图像编辑消除了部署两个独立模型的麻烦。引入了 UNet 的上下文条件机制以统一生成和编辑并提出了任务渐进联合预训练方案即 T2I→编辑→统一联合训练以稳定训练模型。在手机上各种风格转换各种局部编辑统统拿下各项测评基准上比肩 FluxZ-ImageLongCat-Image 等开源模型。团队提供了两种不同变体的 DreamLite 模型以在视觉真实度与设备内推断延迟之间实现最佳平衡。模型权重目前正在进行安全审查。申请抢先体验通过电子邮件联系 klfeng1206outlook.com邮件抬头写 “DreamLite Access Request”。请在邮件中确保包含您的姓名及所属关系例如大学、公司或个人作品集预期使用场景请简要描述您计划如何使用 DreamLite 模型。可能是模型太强了太容易传播团队给了重要警示“访问和使用这些模型即表示您同意遵守我们的道德准则。这些模型不得用于生成、编辑或传播任何性露骨、色情、暴力、歧视或其他非法内容。我们严格禁止将 DreamLite 用于恶意目的。”感兴趣的开发者们赶紧申请来试试。试玩地址https://huggingface.co/spaces/carlofkl/DreamLite参考资料https://carlofkl.github.io/dreamlite/https://arxiv.org/pdf/2603.28713https://github.com/ByteVisionLab/DreamLite

Windows任务栏透明化方案：TranslucentTB的功能解析与应用实践

Windows任务栏透明化方案：TranslucentTB的功能解析与应用实践【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB Windows任务栏作…...

2026/5/8 16:48:13 阅读更多 →

高速多路DAC同步技术解析与工程实践

1. 高速多路DAC同步技术概述在现代无线通信和雷达系统中，多通道数字模拟转换器(DAC)的精确同步是实现高性能信号处理的关键。以MAX19692为代表的2.3Gsps高速DAC，其内置的4:1输入多路复用架构为系统设计带来了灵活性，同时也引入了复杂的时钟同…...

2026/5/8 16:47:55 阅读更多 →

终极植物大战僵尸修改器PvZ Toolkit：让经典游戏焕发新生

终极植物大战僵尸修改器PvZ Toolkit：让经典游戏焕发新生【免费下载链接】pvztoolkit 植物大战僵尸 PC 版综合修改器项目地址: https://gitcode.com/gh_mirrors/pv/pvztoolkit 你是否曾经想过在《植物大战僵尸》中拥有无限阳光，或者创建自己的自…...

2026/5/8 16:47:53 阅读更多 →

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 上周，当我需要从百度网盘下载一个3GB的设计素材时…...

2026/5/8 0:39:19 阅读更多 →

构建Web3多智能体世界：从账户抽象到AI驱动的链上经济

1. 项目概述：一个由AI驱动的Web3多智能体世界EmpowerTours 是一个我深度参与构建的、运行在 Monad 区块链上的综合性 Web3 平台。它不仅仅是一个应用，更是一个持续运行的多智能体世界，并深度集成在 Farcaster 社交协议中，作为一个…...

2026/5/8 0:40:09 阅读更多 →

2026届最火的降AI率网站推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 需要从源头优化以及后期校正两方同时着手，来降低文本里AIGC也就是人工智能生成内…...

2026/5/8 0:02:56 阅读更多 →