极智AI

阅读: 评论:0

极智AI

极智AI

欢迎关注我的公众号 [极智视界],获取我的更多经验分享

大家好,我是极智视界,本文来介绍一下 Colossal-AI高效异构内存管理系统。

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:

首先需要了解一下异构内存中的数据移动,由于 GPU 的内存容量有限,一般没有办法直接容下大模型,这样的话可以使用 CPU 的内存以及 SSD 硬盘来共同存储大模型。在训练深度学习模型的时候,可以在运行时适当地把数据在不同的设备中进行交换,也就是所谓的 data swapping,理想情况下只需要将需要计算的数据保存在 GPU 中,从而可以训练更加大的模型。

微软在自家的大模型加速框架 deepspeed 中提出了 ZeRO (Zero Redundancy Optimizer) 的异构内存管理解决方案。在数据并行的训练中,若不管三七二十一直接加载到每个 GPU,则会存在最大的内存冗余。deepspeed 发现了这个缺点,将模型的参数、梯度和优化器

本文发布于:2024-01-29 06:22:42,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170648056713325.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:极智   AI
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23