将一张图片拆分开来如下图所示,下图的 0,1,2,…,8,9 是用于记录图片的位置信息
更为详细的Encoder Block图
上图中的 MLP Block 图解为
注意:在Transformer Encoder 前有一个Dropout层,后有一个Layer Norm层
训练自己的网络时,可简单将MLP Head层看作一个全连接层
其中:Encoder Block
其中:MLP Block
本文发布于:2024-02-02 21:04:48,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170687908646437.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |