网站首页
编程语言
数据库
系统相关
其他分享
编程问答
BF16
2025-01-01
如何在梯度计算中处理bf16精度损失:混合精度训练中的误差分析
如何在梯度计算中处理bf16精度损失:混合精度训练中的误差分析在现代深度学习训练中,为了加速计算并节省内存,越来越多的训练任务采用混合精度(MixedPrecision)技术,其中常见的做法是使用低精度格式(如bf16或fp16)进行前向传播和梯度计算,而使用高精度格式(如fp32)进行参数更新
2024-12-06
大模型--数据类型FP16 BF16--29
1.参考https://blog.csdn.net/voiiid/article/details/114825246https://blog.csdn.net/shizheng_Li/article/details/1441409122.半精度浮点fp16这两种数据类型编程是经常遇见双精度double,64位单精度float,32位FP16(Half-precisionfloating-pointformat)它提供更高的
2024-12-03
NUS:LLM在BF16与RoPE上存在长上下文挑战