Heretic-v1.2.0烧蚀GLM4.7，离线环境进行

张

张建站

2026/4/30 9:27:06

10分钟阅读

Heretic烧蚀离线环境主要是解决操作过程中从互联网拉取数据集问题使用最终结果各AI模型对这个结果的结论豆包dschatgpt新模型还需要编译安装transformers主要是解决操作过程中从互联网拉取数据集问题项目github地址:https://github.com/p-e-w/heretic使用我在做GLM-4.7-Flash的去审查Unsloth对已量化的GUFF做不了微调所以得自己做一个然后使用Dynamic 2.0 量化环境需求准备一个安装 PyTorch 2.2 的 Python 3.10 环境安装hereticpip install -U heretic-llm进行烧蚀操作heretic Qwen/Qwen3-4B-Instruct-2507heretic开始前会有检查环境等然后尝试通过网络连接到 Hugging Face Hub (huggingface.co) 下载默认的数据集 (mlabonne/harmless_alpaca 和mlabonne/harmful_behaviors)找个互联网环境进行同样操作把数据集拿下来打包带走直接放到linux的~/.cache/huggingface/下或者从魔塔社区或者hf下载https://www.modelscope.cn/organization/mlabonnehttps://hf-mirror.com/mlabonne下载后命令行指定数据集(未测试可行性)heretic Qwen/Qwen3-4B-Instruct-2507 --good-prompts.dataset 和 --bad-prompts.dataset指向数据集文件夹的路径。离线环境开始进行烧蚀需要强制离线不然还会从互联网拉取不读你拿到的缓存$env:HF_DATASETS_OFFLINE 1 #powershell export HF_DATASETS_OFFLINE1 #linux export HF_DATASETS_OFFLINE1;heretic /data/GLM/200 轮trials优化提前终止无效试验Heretic 有内置的剪枝pruning机制如果某轮的 KL 散度超过 --kl-divergence-target默认 0.01会提前终止。你当前的 0.0129 接近阈值后续可能会有试验被提前终止。AI给的介绍从你的输出可以看到当前进度第 14 轮 / 共 200 轮已完成 7%Elapsed time已用时间 22分钟35s预计剩余时间5 小时GPU 显存占用55.89 GB已分配 73.46 GB预留这 200 轮在做什么Heretic 使用 Optuna贝叶斯优化框架来自动搜索最佳的烧蚀参数组合。每一轮都在尝试不同的参数配置目标是最小化拒绝率让模型少说对不起我不能…控制 KL 散度保持模型原有能力不要改得太离谱当前轮次的参数示例direction_index per layerattn.o_proj.max_weight 1.43 # 注意力输出层的最大权重attn.o_proj.min_weight 0.64 # 注意力输出层的最小权重mlp.down_proj.max_weight 0.97 # MLP 下投影层的最大权重…当前效果KL 散度0.0129 ✅很好远低于目标 0.01说明模型改动很小拒绝率73/100 ⚠️还有 73% 的有害提示被拒绝需要继续优化最终结果200轮跑完不满意加了50轮然后出了13/100,14/100,8/100250轮最后一轮的8/100拒绝率我觉得已经ok了200轮截图250轮的各AI模型对这个结果的结论豆包dschatgpt新模型还需要编译安装transformersGLM4.7-flash和qwen3.6都需要镜像是vllm 0.19.0的环境cdtransformers/ pipinstall.-ihttps://artifactory.xxx.cn/api/pypi/csc-pypi-release/simple

原神帧率解锁终极指南：3步告别60FPS限制，享受丝滑游戏体验

原神帧率解锁终极指南：3步告别60FPS限制，享受丝滑游戏体验【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 还在为《原神》PC版60FPS的帧率限制而烦恼吗&#xff1…...

2026/4/30 9:22:35 阅读更多 →

Day19_1047. 删除字符串中的所有相邻重复项

一、今日学习的文章链接和视频链接题目链接：https://leetcode.cn/problems/remove-all-adjacent-duplicates-in-string/ 视频讲解：https://www.bilibili.com/video/BV12a411P7mw 二、自己看到题目的第一想法看到题目要反复删除相邻且相同的字母&…...

2026/4/30 9:21:50 阅读更多 →

逆向知乎x-zse-96加密？别急着扣代码，先搞懂VMP和Webpack混淆再说

逆向知乎x-zse-96加密：从VMP原理到Webpack混淆实战解析当面对知乎这类采用多重保护机制的网站时，许多逆向工程师会直接陷入代码跟踪的泥潭。但真正高效的方法，是先理解其背后的保护体系。本文将带你深入VMP（虚拟机保护&#xff0…...

2026/4/30 9:21:37 阅读更多 →

如何理解临键锁Next-Key Lock_行锁与间隙锁的组合原理解析

临键锁锁定的是左开右闭区间，如对索引值20加锁即锁住(10,20]，包含记录20及前一索引间隙；仅作用于被扫描的索引范围，且在REPEATABLE READ下启用。临键锁到底锁了哪块数据？临键锁不是新锁类型，而是 Record Lo…...

2026/4/30 11:20:20 阅读更多 →

CUDA 13.3 RTX 4090实测报告：FP16混合精度算子性能断层分析（含37个主流PyTorch算子汇编级差异对比）

更多请点击： https://intelliparadigm.com 第一章：CUDA 13.3 RTX 4090混合精度算子性能断层分析总览 NVIDIA RTX 4090 搭载的 Ada Lovelace 架构在 CUDA 13.3 中首次全面启用第三代 Tensor Core 的 FP8 原生支持，使得混合精度计算路径&…...

2026/4/30 11:20:21 阅读更多 →

Vue3项目实战：手写Ant Design Vue a-table拖拽排序（绕过付费功能）

Vue3项目实战：基于Ant Design Vue的a-table手写拖拽排序方案去年接手一个从React迁移到Vue3的项目时，遇到了一个有趣的挑战。项目使用了Ant Design Vue作为UI组件库，在实现菜单管理列表的拖拽排序功能时，发现官方提供的a-table拖…...

2026/4/29 14:47:33 阅读更多 →

2026届最火的AI辅助写作平台实测分析

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在人工智能进行交互期间，指令存在冗余情形常常会致使输出出现偏差以及造成效率方…...

2026/4/30 11:20:20 阅读更多 →