微软提示词压缩技术中:对比困惑度完整计算方法一、先搞懂基础:困惑度(PPL)的本质困惑度是**“模型预测下一个token的难度”**的量化指标,它和token的概率直接相关:困惑度(token) = -ln(模型预测这个token的概率)概率越高 → 模型越容易预测 → 困惑度越低概率越低 → 模型越难预测 → 困惑度越高这里用的是自然对数ln,所有LLM实现都统一用这个二、三个值的精确定义1. 无条件困惑度(token)定义:只看这个token前面的上下文,不看用户问题时,模型预测它的难度。无条件困惑度(token_i) = -ln( P(token_i | 上下文_1...i-1) )这就是原始LLMLingua用的指标,只衡量"这个词本身有多意外"2. 条件困惑度(token | 问题)