MosaicML 推出 300 亿参数模型,训练成本 70 万 天天观天下
【资料图】
AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,单从参数来看,这个模型具有 300 亿参数,放在如今动则上千亿参数的模型领域中并没有什么突出的地方。但这个新模型的训练成本却只有其他模型的零头,有望扩大模型在更广泛领域的运用。
MosaicML 的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元,远低于训练 GPT-3 所需的数千万美元。此外,MPT-30B 模型的质量超过了 OpenAI 在 2020 年发布的初版 GPT-3。由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并部署在本地硬件设备上。
MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往,这使得每 GPU 的吞吐量增加了 2.4 倍以上,带来更快的完成时间。
300 亿参数这是一个在大模型领域经常看到的数字,300 亿参数为什么这么特殊呢?MosaicML 首席科学家 Frankle 则解释道,首先 300 亿参数能够确保它可以在本地硬件上轻松运行,同时保持质量与 GPT-3 差不多或略优于它。
其次任何超过 300 亿参数限制的模型都需要将模型分解成多个平行段,通常也需要更加昂贵的多 GPU 设置。
除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量,以提高模型性能。他们目前正在开发工具,帮助用户在预训练过程中分层加入特定领域的数据。这确保了多样化和高质量的数据组合。将模型扩展到 300 亿参数只是 MosaicML 的第一步,接下来他们将以降低成本为前提,推出更大的、更高质量的模型。
开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在自己的硬件上用自己的数据对模型进行微调。
关键词:
相关阅读
-
MosaicML 推出 300 亿参数模型,训练...
AI创业公司MosaicML近日发布了其语言模型MPT-30B,单从参数来看,这个 -
快消息!市场监管总局:推动气瓶安全排...
6月23日,国家市场监督管理总局在银川市召开市场监管领域安全生产工作 -
外媒:普里戈任称“瓦格纳”部队进入俄...
据法新社等外媒报道,俄南部罗斯托夫州州长瓦西里·戈卢别夫24日敦... -
全球今亮点!msstdfmt.dll丢失修复方法详解
msstdfmt dll是一个Windows系统文件,它提供了一组OLEAutomation格式转 -
M14路、M22路、M33路明起调整 接驳4处...
记者从厦门公交集团获悉,明日起,优化调整M14路、M22路、M33路,接驳 -
党建引领促共建 端午“粽”情暖民心 ...
翔安市政集团泊车管理有限公司党支部组织党员志愿者到马巷街道友民社区 -
“中国天眼”发现迄今轨道周期最短脉冲...
科学家利用“中国天眼”FAST发现了一个轨道周期仅为53分钟的脉冲星... -
沉浸式体验!沪苏轨交11号线“牵手”亮...
沉浸式体验!沪苏轨交11号线“牵手”亮点满满 -
【天天快播报】南京民办校、公办热点校...
6月24日,南京外国语学校以及各区热点公办小学初中、民办小学初中进行 -
健康小站丨高温酷暑即将到来,需警惕低...
潮新闻客户端记者何丽娜通讯员马学琴低血压是一种常见健康问题,但很多 -
运河水系发生今年第1号洪水 天天时快讯
浙江水利官微消息,受集中降雨影响,杭嘉湖区近24小时集中降雨量98 5毫 -
“普京全天候收到汇报”!俄副总指挥呼...
综合《莫斯科时报》和法新社报道,克里姆林宫24日表示,俄罗斯总统普京 -
2022年报中国A股自动化设备上市公司分析...
截至2023年5月31日,2022年报自动化设备共有79家A股上市公司披露数据, -
2022年报中国A股环境治理上市公司分析:...
截至2023年5月31日,2022年报环境治理共有106家A股上市公司披露数据, -
焦点短讯!全球观焦点:知名港星曹查理...
6月23日,据媒体报道,知名港星曹查理目前定居在四川南充,最近圈中好 -
2号线、17号线今晚加开定点加班车,地铁...
据申通地铁集团消息,为方便广大乘客出行,6月24日(周六),上海轨道 -
环球简讯:法定监护人签合同有效么?_全...
一、法定监护人签合同有效么?法定监护人替被监护人签订的合同合法有效 -
赵丽颖白玉兰输给吴越,现场笑容勉强,...
原标题:赵丽颖白玉兰输给吴越,现场笑容勉强,三次陪跑我都替她喊冤! -
环球今日讯!光明72小时创新挑战,新材...
科研者要面向世界科技前沿,走开放进取、思践偕行之路,做世界性的科研 -
全球快消息!煮猪肝冷水下锅还是热水下...
美味的猪肝:猪肝一直是家人比较喜欢的食材,因此家里做的次数也很多。