基于上篇(https://blog.csdn.net/qq_45445740/article/details/158660357?spm=1001.2014.3001.5501)复现后的总结。目录1.ACT调优技巧2.关于训练和推理中的一些参数3.关于dataset_stats.pkl4.关于官方源码不支持数据集长度不同的训练Ref5.关于ACT算法的内容1.ACT调优技巧官方说明的一些调优技巧:https://docs.google.com/document/d/1FVIZfoALXg_ZkYKaYVh-qOlaXveq5CtvJHXkY25eYhs/edit?tab=t.0#heading=h.2xiz3mdijyv4对于现实世界中更难建模的数据,在损失趋于稳定后,至少要进行5000个训练周期或3-4倍于当前训练周期长度的训练。更多信息请参考调优技巧。在将ACT应用于新环境时,组块大小是最重要的调整参数。一个组块应对应机器人约1秒的实际运动时间。高KL权重(10或100),或者不使用CVAE编码器进行训练。考虑移除temporal_agg,并将这里的查询频率增加到与你的块大小相同。即,每个块都被完整执行。长时间训练(在训练进入平台期后仍继续训练,见图) - 尽量增大批量大小,并相应提高学习率。例如,批量大小为64,学习率为5e-5,与批量大小为8,学习率为1e-5相比 - 为每个摄像头设置单独的主干网络(需要修改代码,见此提交记录) - L1损