你的浏览器版本过低，可能导致网站不能正常访问！为了您能正常使用网站功能，请使用这些浏览器。

chrome

Firefox

网站地图

全部频道：

车型

图片

视频

直播

文章

评测

导购

报价

经销商

降价

点评

社区

易车号

新能源

商用车

裸车价

二手车

购车服务：

超值特惠

分期

鲨鱼车展

实用工具：

车型对比

购车计算器

贷款计算器

卖车估值

查看更多>>
移动应用

易车app
手机扫码快速下载


易车小程序
手机扫码打开
 手机易车易车汽车报价淘车车易鑫金融
出版

工具栏

专为大语言模型训练定制微软推出高效FP8混合精度训练框架

作者：贺汝儿
2023-11-10 15:16
357

11月10日消息，来自微软 Azure 和微软研究院的一组研究人员推出了一个高效的 FP8 混合精度框架，专为大型语言模型训练量身定制。

经过测试，与广泛采用的 BF16 混合精度方法相比，FP8 混合精度框架内存占用减少 27% 至 42%，权重梯度通信开销显著降低 63% 至 65%。

运行速度比广泛采用的 BF16 框架（例如 Megatron-LM）快了 64%，比英伟达 Transformer Engine 的速度快了 17%。

在训练 GPT-175B 模型时，混合 FP8 精度框架在 H100 GPU 平台上节省 21% 的内存，而且相比较 TE（Transformer Engine），训练时间减少 17%。

标签: P8

内容由作者提供，不代表易车立场

收藏成功 ! 去易车app查看收藏文章

猜你想看

排行榜

相关资讯

CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有北京易车信息科技有限公司购车咨询：4000-168-168 (周一至周日 9:00 – 21:00) 法定假日除外