编码器解码器层数必须要相等么?
层数是越多越好么?
各层之间的参数共享么?
Transformer模型详解(图解最完整版) - 知乎 (zhihu.com)
标签:Transformer,知乎,编码器,解码器,层数,完整版 From: https://www.cnblogs.com/hbuwyg/p/16981044.html
编码器解码器层数必须要相等么?
层数是越多越好么?
各层之间的参数共享么?
Transformer模型详解(图解最完整版) - 知乎 (zhihu.com)
标签:Transformer,知乎,编码器,解码器,层数,完整版 From: https://www.cnblogs.com/hbuwyg/p/16981044.html