每日热门:MosaicML 推出 300 亿参数模型,训练成本 70 万
时间:2023-06-25 01:31:37来源:OSCHINA


(相关资料图)

AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,单从参数来看,这个模型具有 300 亿参数,放在如今动则上千亿参数的模型领域中并没有什么突出的地方。但这个新模型的训练成本却只有其他模型的零头,有望扩大模型在更广泛领域的运用。

MosaicML 的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元,远低于训练 GPT-3 所需的数千万美元。此外,MPT-30B 模型的质量超过了 OpenAI 在 2020 年发布的初版 GPT-3。由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并部署在本地硬件设备上。

MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往,这使得每 GPU 的吞吐量增加了 2.4 倍以上,带来更快的完成时间。

300 亿参数这是一个在大模型领域经常看到的数字,300 亿参数为什么这么特殊呢?MosaicML 首席科学家 Frankle 则解释道,首先 300 亿参数能够确保它可以在本地硬件上轻松运行,同时保持质量与 GPT-3 差不多或略优于它。

其次任何超过 300 亿参数限制的模型都需要将模型分解成多个平行段,通常也需要更加昂贵的多 GPU 设置。

除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量,以提高模型性能。他们目前正在开发工具,帮助用户在预训练过程中分层加入特定领域的数据。这确保了多样化和高质量的数据组合。将模型扩展到 300 亿参数只是 MosaicML 的第一步,接下来他们将以降低成本为前提,推出更大的、更高质量的模型。

开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在自己的硬件上用自己的数据对模型进行微调。

标签:

最新
  • 每日热门:MosaicML 推出 300 亿参数模型,训练成本 70 万

    AI创业公司MosaicML近日发布了其语言模型MPT-30B,单从参数来看,这个

  • 曼联放弃签芒特?三次被拒曼联认为忙也被高估了

    曼联放弃签芒特?曼彻斯特晚报报道:曼联对切尔西在芒特转会问题上的态

  • 滚动:一般 门票的尺寸做成多少 常见的尺寸有哪些要求_一般 门票的尺寸做成多少 常见的尺寸有哪些

    1、7CM*20CM左右吧!20厘米里其中5厘米是副票,也就是撕下来的那一部分

  • 2023年盐城市中考成绩发布预告

    盐城市2023年中考成绩预计于6月29日20:00公布,考生可通过以下五种方

  • 今日看点:昆仑万维创始人前妻套现“补贴”公司 深交所发问是否在操纵股价

    昆仑万维创始人前妻套现“补贴”公司深交所发问是否在操纵股价,持股,股

  • 边肖教你修理笔记本电脑

    最近,自己修笔记本电脑的问题引起了很多网友的关注。我相信很多朋友已

  • [快讯]惠泰医疗18万限售股6月28日解禁_世界快消息

    CFi CN讯:惠泰医疗(股票代码:688617)在2023年06月28日新增可售A股1

  • 中国援助231名外国公民撤离苏丹详情公布!巴西使馆曾致谢-当前快播

    吴玺还表示,撤离过程中,我们不仅安全撤离了自己的公民,还帮助巴基斯

  • 世界微动态丨世界500强、俄罗斯矿业冶金龙头公司为什么选择布局光明科学城?

    今年6月,全球最大的镍和钯生产商之一,也是全球铂、钴、铜和铑的主要

  • 今热点:可以和小伙伴一起玩哦!经典大富翁游戏推荐给大家

    大富翁类游戏是一种经典的策略游戏,玩家需要通过投骰子走到各个地图格

  • 我国最大海上油田累产原油突破5亿吨!重量相当于近28万头蓝鲸 速读

    6月21日,记者从中国海油天津分公司了解到,我国最大海上油田——渤海

  • 京郊200亩“炫彩”西瓜成熟上市 成为夏季水果市场新宠

    新京报讯(记者曹晶瑞)持续的高温天气,让西瓜的销售进入旺季。6月21

  • 全球速读:商标侵权怎么认定?有人告我商标侵权怎么办? 天天讯息

    商标侵权怎么认定?侵犯商标权的认定条件是:行为人客观上实施了侵犯

  • 深厚覆盖层勘察关键技术(关于深厚覆盖层勘察关键技术介绍)|全球热资讯

    来为大家讲解以上的问题。深厚覆盖层勘察关键技术,厚覆盖层勘察关键技

  • 全球快讯:男子迷路被困多日,喝露水支撑,杭州萧山警方紧急救援

    ​​近日市民赵先生带着一面锦旗来到萧山宁围派出所感谢派出所警力快速

  • 今日看点:vivo手机黑名单在哪里找?vivo手机忘记密码怎样开锁?

    vivo手机黑名单在哪里找?点击应用和权限首先在手机设置菜单中点击

  • 旅游
    • 当前观察:成都洛带古镇端午节有什么好玩活动2023?

    • 租用了一天,张总就决定买入山猫S70_当前聚焦

    • 蒲瓜怎么做好吃_蒲瓜好吃的做法简单介绍-世界最新

    • 平安人寿重庆分公司 “代理退保”套路深,擦亮双眼莫受骗