字节大模型算法实习一二面复盘:从“基础八股”到“手撕公式”的进阶之路岗位:大模型算法实习生|轮次:一二面|风格:一面查基础广度,二面考数学直觉与推导能力适用人群:冲刺字节、腾讯、快手等重工程+重原理的大厂算法岗同学根据近期字节跳动大模型算法实习生的前两轮技术面整理。整体体验非常典型:一面温和扎实,二面陡然拔高。面试官不追求你背下完整框架源码,而是盯着公式的推导逻辑、维度的变化轨迹、以及核心超参的物理意义。以下按轮次拆解真题,并附上答题要点与备战策略。🟢 一面:基础盘与前沿感知1. 项目深挖考察点:技术选型依据、数据流转设计、Bad Case 归因、线上指标对比。应答策略:用STAR框架+Trade-off思维。字节非常看重“为什么选A不选B”。例如:“选 DPO 是因为 RLHF 在业务场景下 Reward Model 不稳定,且 DPO 离线训练更省算力,但代价是缺乏显式偏好探索能力,后续通过 DAPO 动态采样弥补。”2. Attention 计算公式