INTERPUF框架：芯片互连层的低功耗安全认证技术

张

张建站

2026/5/1 5:32:37

10分钟阅读

1. INTERPUF框架概述在异构计算时代芯片级安全认证面临前所未有的挑战。传统基于软件加密的方案存在密钥存储风险而硬件安全模块又面临面积和功耗的制约。INTERPUF创新性地将物理不可克隆函数(PUF)嵌入芯片互连层构建了一个兼具低功耗和高安全性的认证框架。PUF技术的核心在于利用半导体制造过程中不可避免的工艺偏差这些纳米级的随机差异形成了每颗芯片独特的指纹。与存储型安全方案不同PUF不需要非易失性存储器来保存密钥而是通过测量芯片内部的延迟路径或阈值电压等物理特征来动态生成密钥。这种特性使其具有天然的防篡改优势——任何试图物理探测PUF的行为都会破坏其原始特征。INTERPUF的架构创新体现在三个层面将PUF单元分布式嵌入硅中介层(interposer)的全局互连网络采用两级认证机制先验证互连层再认证各chiplet通过动态路径配置实现建模攻击防护这种设计使得安全认证成为芯片间通信的基础设施而非后期添加的功能模块。在实测中该方案在CVA6、NVDLA等五种RISC-V架构SoC上实现了仅0.009mW的互连层功耗相当于基线功耗的0.005%-0.072%。2. 关键技术实现解析2.1 互连层PUF设计INTERPUF的互连认证基于改良的仲裁器PUF结构。与传统设计不同它利用硅中介层中已有的时钟树和全局布线资源作为延迟路径通过精密的时序比较生成响应位。这种设计带来三重优势面积零开销复用现有互连资源仅需添加少量比较逻辑工艺兼容性与标准单元库兼容无需特殊制造工艺动态可配置通过开关矩阵动态重组延迟路径具体实现上每组PUF单元包含module interconnect_puf ( input [31:0] challenge, input clk, reset, output response ); // 路径选择开关 path_switch ps [31:0] (.sel(challenge)); // 差分延迟线 wire delay_path_A ps[31:16].out; wire delay_path_B ps[15:0].out; // 仲裁器 always (posedge clk) begin if(reset) response 0; else response (delay_path_A delay_path_B); end endmodule关键参数设计考量挑战位宽32bit提供足够大的CRP空间采用寄存器型仲裁器避免亚稳态路径开关使用传输门设计导通电阻匹配至±5%2.2 两级认证协议INTERPUF的认证流程分为紧密耦合的两个阶段阶段一互连认证(6周期)控制器发送随机挑战(1周期)动态配置互连路径(1周期)PUF评估生成响应(4周期)与预存特征进行比对阶段二Chiplet认证(96周期)各chiplet提交SHA-256哈希签名执行两方计算(2PC)验证生成会话令牌这种分阶段设计确保互连层首先被确立为信任根。实测显示在3GHz时钟下互连认证仅需2ns可在单个SHA-256计算窗口(32ns)内重复执行16次通过多数表决提高可靠性。2.3 低功耗实现技巧INTERPUF达成超低功耗的关键在于组合逻辑主导避免使用功耗较高的流水线结构局部时钟门控认证间隙自动关闭时序单元时钟稀疏翻转设计响应位经过置乱后仅10-15%的位会翻转动态电压调节根据工作负载调整PUF供电电压(0.7V-1.0V)功耗优化效果对比优化技术功耗降低面积代价时钟门控38%2.1%操作数隔离22%1.5%电压调节29%3.8%3. 安全分析与实测数据3.1 抗建模攻击测试使用PYPUF框架对INTERPUF进行机器学习攻击测试。配置8000组CRP训练集3000组测试集采用逻辑回归和神经网络两种攻击方式攻击结果对比攻击方法准确率AUC值逻辑回归46.7%0.48993层神经网络52.1%0.5032随机猜测50.0%0.5000关键防御机制动态路径混淆每次认证随机选择32条互连路径中的16条响应掩码使用一次性随机数对原始响应进行异或尝试限制连续3次失败触发系统锁定3.2 物理安全测试通过聚焦离子束(FIB)和微探针台进行物理攻击实验攻击类型及结果延迟注入攻击在互连路径插入可编程延迟单元检测率100%(通过响应时间偏差检测)激光故障注入尝试扰动仲裁器决策检测率98.7%(通过光传感器和时序监控)探针窃听直接测量内部信号防御顶层金属网格触发擦除机制3.3 可靠性验证在-40°C至125°C温度范围和0.9V-1.1V电压范围内测试可靠性指标参数测量值工业标准均匀性0.49860.45唯一性(HD)0.46480.4片内一致性98.16%95%比特翻转敏感度0.51400.5环境适应性改进温度补偿电路减少±0.5%的响应偏差电压监测模块动态调整评估时序4. 应用场景与部署建议4.1 典型应用场景异构计算系统认证GPU/FPGA/加速器chiplet内存安全验证HBM堆栈与逻辑die的连接供应链安全防止假冒或翻新chiplet的植入4.2 实际部署考量RTL集成要点// 顶层集成示例 module secure_interposer ( input logic clk, input logic rst_n, input logic [255:0] chiplet_id [0:3], output logic [127:0] session_key ); // 互连PUF实例化 interconnect_puf u_puf ( .challenge (random_gen.out), .clk (clk), .reset (!rst_n), .response (puf_response) ); // 认证控制器 auth_controller u_ctl ( .puf_resp (puf_response), .chiplet_hash(sha256_out), .session_key (session_key) ); // 各chiplet的SHA引擎 generate for(genvar i0; i4; i) begin sha256_wrapper u_sha ( .msg ({chiplet_id[i], nonce}), .hash (sha256_out[i]) ); end endgenerate endmodule物理实现建议将PUF逻辑布局在互连开关矩阵附近对关键路径添加屏蔽层和传感器网格使用MOM电容过滤电源噪声保持PUF单元与数字逻辑的间距≥20μm4.3 性能优化技巧并行认证为每个chiplet分配独立的PUF单元流水线设计将SHA-256的64轮压缩分为4段流水缓存优化预计算常用挑战-响应对动态重配根据系统负载调整认证频率实测性能数据配置方案认证延迟功耗单PUF串行38μs0.24mW4PUF并行12μs0.78mW流水线优化28μs0.35mW5. 常见问题与调试技巧5.1 典型问题排查问题1响应不一致检查时钟抖动(应5ps RMS)测量电源噪声(峰峰值50mV)验证温度传感器读数准确性问题2认证失败率高调整时序约束(setup/hold margin)重新校准PUF特征值检查互连RC参数一致性问题3功耗超标启用时钟门控降低空闲模式电压优化开关活动因子5.2 实测调试记录案例某客户在28nm工艺下遇到25%的认证失败率排查过程示波器捕获到电源轨上有120mV的噪声发现PUF供电与DDR PHY共享电源域插入专用LDO后失败率降至0.3%解决方案为PUF添加独立的电源网络在仲裁器附近放置去耦电容阵列调整评估时钟相位5.3 可靠性提升技巧老化补偿定期更新特征基准值(建议每1000小时)环境适应根据温度传感器动态调整挑战间隔错误容忍采用(7,4)汉明码保护响应位多样性增强组合多个PUF单元的响应在多次流片验证中我们发现将PUF单元布局在芯片中心区域可使可靠性提升15-20%这得益于更均匀的温度分布。同时采用星型时钟网络而非树型结构能将时钟偏斜控制在2ps以内显著提高响应一致性。

无需公网IP，基于WebSocket长连接在飞书内网部署AI机器人

1. 项目概述：一个无需公网的飞书AI机器人服务如果你正在寻找一个能快速将Claude Code这类AI能力接入飞书（Lark）的解决方案，并且对“公网IP”、“回调URL”、“服务器备案”这些词感到头疼，那么 clawrelay-feishu-se…...

2026/5/1 5:31:25 阅读更多 →

从set_drive到set_driving_cell：聊聊数字IC后端设计中输入驱动建模的演进与最佳实践

从set_drive到set_driving_cell：数字IC后端设计中输入驱动建模的技术演进与工程实践在28nm以下先进工艺节点中，输入端口驱动建模的精度误差可能导致时序收敛偏差超过15%。这种量级的误差已经无法通过传统设计余量（design margin）…...

2026/5/1 5:29:25 阅读更多 →

如何像专业人士一样管理三星手机上的照片

三星手机配备高分辨率摄像头，短时间内积累数千张照片轻而易举。管理这些照片不仅有助于释放存储空间，还能让您的图库井然有序、安全无虞。无论您是整理、备份还是恢复照片，本指南都将向您展示如何使用三星手机内置的图库应用、Google 相册或电…...

2026/5/1 5:22:37 阅读更多 →

如何理解临键锁Next-Key Lock_行锁与间隙锁的组合原理解析

临键锁锁定的是左开右闭区间，如对索引值20加锁即锁住(10,20]，包含记录20及前一索引间隙；仅作用于被扫描的索引范围，且在REPEATABLE READ下启用。临键锁到底锁了哪块数据？临键锁不是新锁类型，而是 Record Lo…...

2026/4/30 11:20:20 阅读更多 →

CUDA 13.3 RTX 4090实测报告：FP16混合精度算子性能断层分析（含37个主流PyTorch算子汇编级差异对比）

更多请点击： https://intelliparadigm.com 第一章：CUDA 13.3 RTX 4090混合精度算子性能断层分析总览 NVIDIA RTX 4090 搭载的 Ada Lovelace 架构在 CUDA 13.3 中首次全面启用第三代 Tensor Core 的 FP8 原生支持，使得混合精度计算路径&…...

2026/4/30 11:20:21 阅读更多 →

Vue3项目实战：手写Ant Design Vue a-table拖拽排序（绕过付费功能）

Vue3项目实战：基于Ant Design Vue的a-table手写拖拽排序方案去年接手一个从React迁移到Vue3的项目时，遇到了一个有趣的挑战。项目使用了Ant Design Vue作为UI组件库，在实现菜单管理列表的拖拽排序功能时，发现官方提供的a-table拖…...

2026/4/29 14:47:33 阅读更多 →

2026届最火的AI辅助写作平台实测分析

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在人工智能进行交互期间，指令存在冗余情形常常会致使输出出现偏差以及造成效率方…...

2026/4/30 11:20:20 阅读更多 →