华为:昇腾AI计算平台训练出准万亿MoE模型|界面新闻 · 快讯

DANBgkqhk 13 0

5月30日消息,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。

  • 药明康德营利双增的一季报说明了什么?|界面新闻
  • 最高超360亿元,全球“店王”北京SKP或被出售|界面新闻
  • 北京楼市暖春:央企中海大手笔拿下单价“地王”,海淀上演大抢房|界面新闻 · 地产
  • 内斗中的凯利泰又又又换董事长了|界面新闻
  • 险资私募加速入场!超千亿资金将启动,这些投资方向或受青睐|界面新闻
  • 马斯克大胆预测:5年内机器人将超越人类最顶尖的外科医生|界面新闻 · 科技
  • 一季度规模以上工业企业利润同比增长0.8%,延续持续恢复态势|界面新闻
  • 百济神州打赢“十亿美元分子”保卫战|界面新闻
  • 港股三大指数走弱,加密货币、核电股受资金追捧|界面新闻
  • 成都银行业绩会:对公业务打法近2-3年不会做大的改变|界面新闻
  • 罗氏宣布投资超20亿人民币,在华新建生物制药生产基地|界面新闻
  • 年报双降,一季报倍增,钾肥龙头亚钾国际能上演“V型反转”吗?|界面新闻 · 证券
  • 国家发改委:建立实施育儿补贴制度,限购城市定向增发购车指标|界面新闻
  • 【独家】“厦门帮”“郑州帮”头部白牌商家密集参加天猫闭门会|界面新闻 · 科技
  • 上海国际金融中心再升级!多部门详解跨境金融服务便利化|界面新闻
  • 抱歉,评论功能暂时关闭!