聚焦

MosaicML发布300亿参数的MPT-30B语言模型，训练成本大幅降低环球新要闻

2023-06-25 16:11:29 ITBEAR

(资料图片仅供参考)

【ITBEAR科技资讯】6月25日消息，AI 创业公司MosaicML近日发布了一款名为MPT-30B的语言模型，该模型拥有300亿参数，训练成本远低于其他竞争对手，有望推动AI模型在更广泛领域的应用并逐步降低训练成本。

MosaicML首席执行官兼联合创始人Naveen Rao表示，MPT-30B的训练成本仅为70万美元(约502.44万元人民币)，远低于类似产品如GPT-3所需的数千万美元训练成本。该模型由于成本低、体积小，可以更快速地进行训练，并且更适合在本地硬件上部署。

据ITBEAR科技资讯了解，MosaicML采用了Alibi和FlashAttention技术来优化模型，这些技术可以实现更长的文本长度和更高的GPU计算利用率。MosaicML还是少数几个能够使用Nvidia H100 GPU的实验室之一，相较于以往的成果，他们的每块GPU吞吐量提高了2.4倍以上，从而可以更快地完成训练过程。

除了使AI技术更易获取外，MosaicML还专注于提高数据质量并提升模型性能。他们目前正在开发一款工具，可以在预训练过程中逐步引入特定领域的数据，以确保训练中包含多样化且高质量的数据组合。

MosaicML表示，将模型参数扩展到300亿只是第一步，接下来他们将以降低成本为前提，推出更大体积、更高质量的模型。

需要注意的是，开发者可以从Hugging Face下载并使用开源的MPT-30B基础模型，还可以使用自己的数据在本地硬件上进行微调。

为你推荐

MosaicML发布300亿参数的MPT-30B语言模型，训练成本大幅降低环球新要闻

ITBEAR 2023-06-25

东方甄选的“小号”，悄悄超越罗永浩

CBNData 2023-06-25

实时焦点：打印机可以打印但是不能扫描_打印机可以打印不能扫描是什么原因

互联网 2023-06-25

爵士新秀亨德里克斯将穿0号球衣，霍顿-塔克穿回5号球衣

手机网易网 2023-06-25

超舒适享自由，星纪元STERRA ES开启美好露营旅行-世界观察

大众网 2023-06-25

天天头条：新华社送你一本22城文化指南

新华社 2023-06-25

环球速递！美国登月真假

互联网 2023-06-25

当前播报:武汉地铁11号线四期最新进展来了

九派新闻 2023-06-25

肚脐眼上面痛是什么原因呢_肚脐眼上面痛是什么原因

互联网 2023-06-25

球探：文-贝克二世将代表雄鹿出战夏联其父曾在NBA征战过13年实时

直播吧 2023-06-25

快消息！冰激凌加盟店要多少钱（冰激凌加盟店）

互联网 2023-06-25

全球今头条！42岁知名网络文学编辑刘英（笔名：血酬）去世

澎湃新闻 2023-06-25

募资近200亿元！隆基发布瑞士上市预案

OFweek太阳能光伏网 2023-06-25

帮助车企造好车！华为公布全新安全气囊专利：根据坐姿调整气囊展开状态世界球精选

凤凰网 2023-06-25

前5个月武威招商引资到位资金125.1亿元-环球要闻

中国新闻网 2023-06-25

黄河滩西瓜、诸城绿茶……山东乡村特色产业蓬勃发展

大众报业·大众日报 2023-06-25

世界新消息丨哪版唐僧追着妖怪打？《西行记燃魂》720公测惊现“硬核三藏”

游戏边小虐 2023-06-25

时夏方长房地产继续等待利好政策出台热闻

观点 2023-06-25

环球动态:spandex是什么成分_spandex是什么面料

互联网 2023-06-25

炮塔防御修改器_塔防游戏修改器天天播报

科学教育网 2023-06-25

打造“家门口的博物馆”！烟台博物馆联盟“文化进万家”保利专场成功举办

东方资讯 2023-06-24

世界新资讯：俄罗斯总统普京与多国领导人通电话

国际金融报网 2023-06-24

陈赫为什么会和张子萱结婚终于知道陈赫为何抛弃前妻）

2023-06-24

焦点滚动:汪小菲当年的醉话，现在听一点儿也不醉……

新浪娱乐 2023-06-24

明天18：00，中考可查分

如东新媒体 2023-06-24

垄断竞争市场的特征有哪些（垄断竞争市场具有哪些特点）当前讯息

互联网 2023-06-24

搜狗明医是什么（搜狗明医功能详细介绍及使用方法【图文】）

互联网 2023-06-24

当前最新：祥生控股集团：安永辞任公司核数师已接获港交所复牌指引

澎湃新闻 2023-06-24

一场拉锯近6年的诉讼：地基下沉商铺成危房，资料缺失鉴定难|全球新动态

澎湃新闻 2023-06-24

新时代上海产业菁英｜郑双燕带领江南造船团队十年磨剑，摘下“船舶工业皇冠上的明珠” 观焦点

文汇报 2023-06-24

小舍得为什么下线了_小舍得被建议停播

青年汽车云小站 2023-06-24

最新快讯!猫被同伴揍，躲在鸡舍不出来！我超喜欢在里面的感觉！

个人图书馆-灵魂出窍KKK 2023-06-24

非遗游、避暑游、文化游……端午假期这些消费新体验等你打卡！

央视新闻客户端 2023-06-24

东城高且长指的是哪_东城高且长原文及翻译看点

互联网 2023-06-24

每日关注!高温阵雨“手牵手” 甘肃这些地方地灾风险较高

凤凰网 2023-06-24

全球要闻：美国财政部对两名俄罗斯官员实施制裁

环球网 2023-06-24

热门中概股多数下跌虎牙、小鹏汽车跌超6%

哈富证券 2023-06-24

消防体制改革后果如何看待消防职业化改革|世界看热讯

互联网 2023-06-24

环球热文：投资97.63亿！长乐又一高速传来新进展！

长乐地产前沿 2023-06-24

2023年端午节，这3种家庭不能挂艾草，看看有你没？

爱美圈周周 2023-06-23

集中采购是什么意思例子（集中采购是什么意思）|天天讯息

互联网 2023-06-23

美联储博斯蒂克：目前未看到经济中出现风险因素。|世界速递

互联网 2023-06-23

遇到燃气泄漏应该如何处理？这份安全提示请查收

央视新闻客户端、陕西省消防救援总队 2023-06-23

记者：黄潜中场帕雷霍是巴萨后腰引援的又一选项

懂球帝 2023-06-23

聚焦：帆船爱好者看过来！不出北京这里一样可实现扬帆碧浪

央视新闻客户端 2023-06-23

连续两日超40℃！北京破纪录

正观新闻 2023-06-23

仙剑6修改器_仙剑6修改器小幸破解版多功能修改版

科学教育网 2023-06-23

环球热头条丨岳阳县检察院开展企业安全生产走访调研

湖南日报 2023-06-23

“听话水”送货上门迷药网络灰色销售链调查全球微动态

法治日报 2023-06-23

焦点快看：《非诚勿扰3》开机！这一次，终于轮到65岁的冯小刚翻身了

腾讯网 2023-06-23

量化私募超额收益提升！全球播资讯

上海证券报 2023-06-23

焦点观察：这一次，中快餐饮集团的董事长李平金本人，被深扒了个底儿朝天！

王老师日常 2023-06-23

全国职工摄影采风团走进贵阳_环球短讯

工人日报 2023-06-23

扁鼻子怎么办_有什么方法解决

互联网 2023-06-23

睇龙舟景吃龙船饭！广州猎德村最大规模端午龙船饭开席独家焦点

南方日报 2023-06-23

自我认识100字_自我认识

互联网 2023-06-23

队记：斯玛特对被交易无比震惊他爱绿军&曾想在这退役-速讯

直播吧 2023-06-23

同一首歌ktv俱乐部_同一首歌ktv 世界今热点

互联网 2023-06-23

人生啊是什么意思_RSA是什么意思视讯

互联网 2023-06-23

“鄂电红马甲”为武穴中考学子护航加油

荆楚网 2023-06-23

【天天快播报】见义勇为的意思和含义（见义勇为的意思）

互联网 2023-06-22

天天新消息丨dnf智慧深渊怎么开（dnf新深渊怎么开）

互联网 2023-06-22

装机医院推介丨宁波市妇女儿童医院引进装机永磁旋振治疗仪简讯

仁惠生殖健康医疗设备研究中心 2023-06-22

今晚4号线北京南站至安河桥北延长运营时间焦点关注

央视新闻客户端 2023-06-22

房产证过户需要夫妻双方都到场吗

问法 2023-06-22

榨汁机是原汁机好还是加水的好榨汁机和原汁机的区别

城市网 2023-06-22

宁夏银川烧烤店爆炸事故9名相关人员已被警方控制全球热文

中国日报网 2023-06-22

直击端午全国人从众：泰山人山人海

快科技 2023-06-22

终于找到适合普通人的连衣裙穿搭，又舒适又时髦，值得借鉴_全球快播报

眼涙斯搞笑 2023-06-22

6G大显存英特尔A380显卡杀到759元

中关村在线 2023-06-22

画面温馨！约60只海豚在海警舰艇附近跳跃嬉戏

央视新闻客户端 2023-06-22

【天天新视野】每天待在雇主家的保姆是什么感觉?

南方养生网 2023-06-22

雪松国际信托被罚220万：以现金管理类产品的名义误导投资者等|每日精选

中新经纬 2023-06-22

环球资讯：端午佳节，愿美好接“粽”而来

宿迁网 2023-06-22

菠萝蜜上火还是降火_菠萝蜜上火

互联网 2023-06-22

【报资讯】鱼越养越少园区放干水库里发现真凶：一条50斤鳄雀鳝

快科技 2023-06-22

八开纸正度和大度是什么意思_八开纸

互联网 2023-06-22

大唐潼金(08299)发盈喜预期年度股东应占溢利不低于2500万港元

智通财经 2023-06-22

天下3搬砖攻略_天下3赚钱攻略

互联网 2023-06-22

股票行情快报：远信工业（301053）6月21日主力资金净买入214.09万元

证券之星 2023-06-22

【天天聚看点】掘金夺冠奇兵布朗跳出合同成完全自由球员冲千万年薪+有望引哄抢

醉卧浮生 2023-06-21

注意！昆明市住房公积金管理中心安宁管理部停业搬迁

掌上春城 2023-06-21

速读：重庆轨道18号线全线接触网送电成功

央视新闻客户端 2023-06-21

今日视点：马云复出：电商三强鼎立，618购物节“一出好戏”即将！

壹仑科技 2023-06-21

武器大师皮肤武神_武器大师皮肤

互联网 2023-06-21

又到避暑纳凉季济南9处人防工程避暑纳凉点等你来今日关注

闪电新闻 2023-06-21

净资产1999亿元！深入了解广东恒健投资控股有限公司全球视讯

企业消息 2023-06-21

桂木果的食用方法（桂木果的食用方法及禁忌）

互联网 2023-06-21

全球速看：山外山：子公司一次性使用血液灌流器获医疗器械注册证

界面新闻 2023-06-21

环球聚焦：端午粽飘香边关警民情谊浓

金台资讯 2023-06-21

证监会更新证券公司白名单，31家券商入榜，这5家新入围！监管重点关注这些指标_热文

券商中国 2023-06-21

彩缕碧筠粽成都“粽子一条街”节日氛围满满

央广网 2023-06-21

天天精选！南钢球团厂带式焙烧球团生产线技术改造项目通过综合竣工验收

中钢网 2023-06-21

环球通讯！这次，年轻人爱上了CityWalk

鸟哥笔记 2023-06-21

家有初长成的小女儿，父母的感慨与期望-全球视讯

互联网 2023-06-21

天天动态:欧预赛-莱万、米利克破门波兰2-3摩尔多瓦遭连扳3球大逆转

直播吧 2023-06-21

申通快递费用价格计算_申通价格|每日资讯

互联网 2023-06-21

大红酸枝家具价格2015（大红酸枝家具价格）|环球百事通

互联网 2023-06-21

“超级LED屏”点亮！国内首个5G智慧虚拟拍摄联合实验室落地无锡热讯

上海证券报·中国证券网 2023-06-21

【当前热闻】假面超人亡国之鸦大结局（下）

哔哩哔哩 2023-06-21

煮酒论车丨哈弗枭龙MAX的市场竞争逻辑当前讯息

汽车之家 2023-06-21

陇神戎发股东户数增加1.59%，户均持股8.98万元天天百事通

东方财富Choice数据 2023-06-21

展示“新豪华” 北京金港腾势中心开业-焦点速递

爱卡汽车网 2023-06-21

天天快播：6月份1年期、5年期以上LPR均下调10个基点

证券日报 2023-06-21

速讯：离岸人民币对美元一度跌破7.2关口，去年11月末以来首次

澎湃新闻 2023-06-21

晶能微电子完成A轮融资_速看料

钛媒体官方 2023-06-21

【独家】灵康药业：子公司注射用头孢呋辛钠通过仿制药一致性评价

每日经济新闻 2023-06-20

市场需求下 OLED面板驱动芯片将向28nm制程迭代-天天看点

电子工程网 2023-06-20

全球热讯:今年618：投入最大、创新最多，消费者却异常冷静 | 见智研究

华尔街见闻 2023-06-20

天天热文：✊FAMILY！字母哥斥资1100万美元在雅典为家族买豪宅

直播吧 2023-06-20

港股云顶新耀快速拉升涨超22%

界面新闻 2023-06-20

“辩”明是非，“论”启思想中央音乐学院这场辩论赛展现“人文央音”育人成效世界观点

中国青年网 2023-06-20

只想底薪签保罗！湖人3大目标出炉快船勇士搅局亲信曝老詹计划今日讯

锅子篮球 2023-06-20

曹县县委书记解析：如何从“一时红”变成“长久红”

百度新闻 2023-06-20

兔年金条价格今天多少一克（2023年06月20日）每日视点

金投网 2023-06-20

女幼师称喂幼儿避孕药:长大都废了|热头条

腾阅网 2023-06-20

当前焦点!花都丽美大酒店

互联网 2023-06-20

焦点关注：毛坦厂中学收费标准

互联网 2023-06-20

世界讯息：【原创】炎炎端午话屈原

个人图书馆-紫云烟xsg 2023-06-20

江苏特大城市或将只剩南京（南京是江苏的省城吗全球热点

互联网 2023-06-20

4%! 民营银行大额存单利率“逆风而行”

上海证券报 2023-06-20

中化国际发布《2022年度可持续发展报告》-全球快播

KE科日光伏网 2023-06-20

天天速看：金融地产ETF：融资净偿还16.27万元，融资余额239.57万元（06-19）

东方财富Choice数据 2023-06-20

科大讯飞：用人工智能技术打造智慧家庭安全防线

厂商供稿 2023-06-20

易点天下（301171）：6月19日北向资金减持13.45万股

证券之星 2023-06-20

三九健康日活动在苏州举行|环球关注

第一药店财智 2023-06-20

焦点要闻：一个山一个由字怎么念_一个山一个由

互联网 2023-06-20

荣耀畅玩30M本机号码在哪看世界热消息

互联网 2023-06-20

平衡点上的《铃芽之旅》——铃芽之旅的一种结构模型

哔哩哔哩 2023-06-19

速讯：郑重看股：选股两点一盯主线二是量价

腾讯网 2023-06-19

足球漫画：曼联球迷等俱乐部新老板入主已经等麻了。... 全球速看料

懂球帝 2023-06-19

6月23日0时起，这个匝道即将关闭！中环立交改建施工将启动

新民晚报 2023-06-19

菲律宾莱西姆大学财政管理博士环球热点

教育联展网 2023-06-19

质量定义中的要求是指什么（质量定义）

互联网 2023-06-19

世界观热点：重药控股(000950.SZ)：公司有销售部分医美相关产品，整体占比较小

格隆汇 2023-06-19

男性刮胡子频率,和寿命有关!在2个时间点,尽量别刮胡子-全球快资讯

互联网 2023-06-19

当前最新：慈利县甘堰土家族乡：强化烘烤技能培训，助力烟农增产增收

红网 2023-06-19

浙江防汛进入战时状态|每日精选

央视网 2023-06-19

环球快看点丨大s被黄子佼拉下水，张兰直播做了三件事，网友：团队也很会整活

偶像说 2023-06-19

天天滚动:日本警方逮捕一名中国籍研究员，外交部：已向日方表达严重关切

互联网 2023-06-19

焦点短讯！2023高考查分时间 2023高考各地成绩查询时间汇总

互联网 2023-06-19

宋一

互联网 2023-06-19

Apple X如何设置屏幕旋转_每日简讯

互联网 2023-06-19

史鸿飞身高体重（史鸿飞身高）-环球动态

互联网 2023-06-19

游客在贵州梵净山景区岩壁上刻字，当地警方和文保部门介入调查|实时

光明网 2023-06-19

今日报丨华夏沪深300etf代码_华夏沪深三百

互联网 2023-06-19

去日本旅游，关于行李箱的问题~！-世界今日讯

环球旅程网 2023-06-19

速看：极目时评|父亲带12岁女儿休学1年骑行游中国，先别说人家“家里有矿”

极目新闻 2023-06-19

实时：让人唏嘘！2米25潜力内线遭张庆鹏放弃，下赛季面临无球可打

小陆说球 2023-06-19

国产主流电影家国情怀艺术化路径越走越宽天天快看

澎湃新闻 2023-06-19

土办法配新科技：一名宁夏治沙人的“绿色实践”

中卫市广播电视台 2023-06-19

三个主要原因！日本废钢行业面临挑战

世界金属导报 2023-06-19

拜登要征收富人税？全球首富马斯克“回怼”：他只是说说而已每日报道

凤凰网 2023-06-19

异地验车

互联网 2023-06-19

焦点速讯：女性尿路感染反复发作什么原因_女性尿路反复感染怎么办

互联网 2023-06-19

亿华通与TAM将合作开发针对欧洲市场的氢燃料电池车-天天观察

和讯王治强 2023-06-19

天天微动态丨胃病食疗胃病食疗指南

互联网 2023-06-19

扬州两线路入选“水韵江苏” 非遗主题精品旅游线路环球播资讯

扬州晚报-扬州网 2023-06-19

【机构调研记录】鹏扬基金调研长久物流

证券之星 2023-06-19

视讯！派系防御大亨代码——有吗？

酷易软件园 2023-06-18

每日关注!让家变得更“聪明”（经济新方位·衣食住行看转型）

人民日报 2023-06-18

百果园回应“女子团购西瓜被嘲讽”：系误解

大河财立方 2023-06-18

全球热点评！动物大联盟魔剑在哪爆

电脑技术吧 2023-06-18

环球时讯：划龙舟迎端午

新华社 2023-06-18

全国智运会桥牌项目河南省选拔赛第二期落幕

郑州日报 2023-06-18

官方全案审查“特校校长猥亵学生被判三年半”_每日看点

湖北经视 2023-06-18

热文：香港名媛碎尸案新进展：蔡天凤葬礼耗资300万，不设瞻仰遗容

大象新闻 2023-06-18

每日速讯：彝族主要分布在哪个省

楚天视界 2023-06-18

一组跨越36年家庭照背后的故事

中国青年网 2023-06-18

读创公司调研｜长安汽车：已累计进入全球63个市场海外已建成450家销售渠道

读创 2023-06-18

当前讯息：鄱阳县气象台发布大风蓝色预警信号【IV级/一般】【2023-06-18】

九派新闻 2023-06-18

今热点：陈华主持召开湘西州政府党组会议

湖南日报 2023-06-18

助力国际消费中心城市建设，北京朝阳又添大型商业综合体

千龙网 2023-06-18

日本为何出现巨额贸易逆差

新华网 2023-06-18

莲花美、麦秆香！全国多地“丰”景如画世界快资讯

央视新闻客户端 2023-06-18

有补助有工作！浙江省定向培养这类人才招1780名

杭州发布 2023-06-18

陈启宗：楼市未来3年续向好加息影响微-世界快播

中评网 2023-06-18

江苏省委书记信长星：做党的创新理论坚定信仰者忠实实践者

金台资讯 2023-06-18

如果光听《一拳超人》这个名字，或许都猜不到这是部什么动漫_当前短讯

小溪de情感 2023-06-18

时隔三年青岛至台北航线正式复航_天天精选

北青网 2023-06-18

世界速讯：壳资源概念股-壳资源概念股一览

互联网 2023-06-18

球迷同款跑鞋意外爆火商家连夜改图：一双好鞋掌控全场

证券时报 2023-06-18

云商会与医月达成生态合作，为数字医疗扬帆助力

云商会Solink 2023-06-18

厨房吊顶一般多高适合（厨房吊顶一般多高）

互联网 2023-06-18

使用这些技巧让您的Zoom通话比以前更流畅|今日精选

互联网 2023-06-17

四氧化三铁与盐酸反应的离子方程式最新

城市网 2023-06-17

适合发朋友圈的唯美文案时讯

互联网 2023-06-17

海默科技：基于海默潘多拉自研工业低代码平台的Smart MES系统首次出口国际市场

证券时报 2023-06-17

热资讯！清华发布中小学数字化五育并举报告，加强师资培训推进教育数字化

北京日报客户端 2023-06-17

天天动态:图鉴是什么意思啊图鉴是什么意思

城市网 2023-06-17

星际战甲脖子上的瘤有什么用星际战甲战甲脖子有瘤

元宇宙网 2023-06-17

【世界热闻】京东（青海）数字经济产业园在西宁市城西区正式开园运营

电商报 2023-06-17

标志Vision GT价格揭秘：究竟多少钱？

汽车时代网 2023-06-17

地产主业式微，重组珠海免税中止，格力地产转型艰难

证券市场红周刊 2023-06-17

新员工入职申请表范文|世界今热点

互联网 2023-06-17

通讯！2023年6月16日国内各大市场铜升贴水汇总

九商云汇 2023-06-17

美利金生a款终身年金保险（分红型）怎么样？怎么买？世界独家

马蜂保 2023-06-17

速递！株洲招标书怎么写

法师兄 2023-06-17

前沿热点：广州地铁3号线谋“上市”，意义何在？

红星资本局 2023-06-17

wps冻结窗口怎么设置冻结行和列_wps冻结窗口怎么设置当前速讯

互联网 2023-06-17