首页 > 其他分享 >【NLP高频面题 - LLM架构篇】大模型为何使用RMSNorm代替LayerNorm?

【NLP高频面题 - LLM架构篇】大模型为何使用RMSNorm代替LayerNorm?

时间:2024-11-29 15:33:33浏览次数:5  
标签:NLP 高频 LayerNorm 宝典 RMSNorm 面试 要会 面题

【NLP高频面题 - LLM架构篇】大模型为何使用RMSNorm代替LayerNorm?

重要性:★★★

标签:NLP,高频,LayerNorm,宝典,RMSNorm,面试,要会,面题
From: https://www.cnblogs.com/fasterai/p/18576846

相关文章