论文笔记

阅读: 评论:0

论文笔记

论文笔记

目录

摘要

1.大纲

2.Baseline

2.1训练预处理

2.2测试预处理

3.改进点

3.1 训练速度

3.1.1 batch size调整

3.2 网络结构

3.2.1 模型调整​

 3.3 训练过程优化

 3.3.1 Cosine Learning Rate Decay

3.3.2 Label Smoothing

3.2.3 知识蒸馏(Knowledge Distillation)

本文发布于:2024-01-29 20:04:56,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170652989817946.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:笔记   论文
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23