破10万亿！达摩院实现全球最大AI预训练模型：远超谷歌、微软_城市科技网

在人工智能前沿领域，中国AI实现突破。11月8日，阿里巴巴达摩院公布多模态大模型M6最新进展，其参数已从万亿跃迁至10万亿，规模远超Google、微软此前发布的万亿级模型，成为全球最大的AI预训练模型。同时，M6做到了业内极致的低碳高效，使用512 GPU在10天内即训练出具有可用水平的10万亿模型。

相比去年发布的大模型GPT-3，M6实现同等参数规模，能耗仅为其1%。

M6是达摩院研发的通用性人工智能大模型，拥有多模态、多任务能力，其认知和创造能力超越传统AI，尤其擅长设计、写作、问答，在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。

与传统AI相比，大模型拥有成百上千倍“神经元”数量，且预先学习过海量知识，表现出像人类一样“举一反三”的学习能力。

因此，大模型被普遍认为是未来的“基础模型”，将成下一代AI基础设施。然而，其算力成本相当高昂，训练1750亿参数语言大模型GPT-3所需能耗，相当于汽车行驶地月往返距离。

今年5月，通过专家并行策略及优化技术，达摩院M6团队将万亿模型能耗降低超八成、效率提升近11倍。

10月，M6再次突破业界极限，通过更细粒度的CPU offload、共享-解除算法等创新技术，让收敛效率进一步提升7倍，这使得模型规模扩大10倍的情况下，能耗未显著增加。

这一系列突破极大降低了大模型研究门槛，让一台机器训练出一个千亿模型成为可能。

同时，达摩院联合阿里云推出了M6服务化平台，为大模型训练及应用提供完备工具，首次让大模型实现“开箱即用”，算法人员及普通用户均可方便地使用平台。

达摩院还推出了当前最大规模的中文多模态评测数据集MUGE，覆盖图文描述、文本生成图像、跨模态检索任务，填补了缺少中文多模态权威评测基准的空白。

作为国内首个商业化落地的多模态大模型，M6已在超40个场景中应用，日调用量上亿。

今年，大模型首次支持双11。M6在犀牛智造为品牌设计的服饰已在淘宝上线；凭借流畅的写作能力，M6正为天猫虚拟主播创作剧本；依靠多模态理解能力，M6正在增进淘宝、支付宝等平台的搜索及内容认知精度。

达摩院智能计算实验室负责人周靖人表示，“接下来，我们将深入研究大脑认知机理，致力于将M6的认知力提升至接近人类的水平，比如，通过模拟人类跨模态的知识抽取和理解方式，构建通用的人工智能算法底层框架；另一方面，不断增强M6在不同场景中的创造力，产生出色的应用价值。”

据了解，达摩院语言大模型PLUG近期也已升级至2万亿参数，成为全球最大中文语言模型，其所属AliceMind语言模型体系同样推出了服务化平台。

标签：

责任编辑： jkl2

“表演服”用完就退？不能放任后悔权被滥用世界短讯
“七天无理由退货”本是为了保护消费者合法权益，但有人利用...
周大生：去年电商业务收入同比增35%，今年目标超去年增速_全球看点
周大生在机构调研时表示，2022年电商业务收入同比增长34 65%...
视频号运费险正式上线，首次投保根据经营类目有5档选择环球播报
据亿邦动力消息，腾讯发布“视频号小店运费险”服务指南，视...
淘宝发布中小商家造星计划，推出最高2000元广告补贴券
淘宝宣布启动中小商家的造星计划，推出包含最高2000元广告补...
OpenAI CEO：OpenAI还没有开始训练GPT-5大模型天天播报
据外媒报道，OpenAI首席执行官SamAltman在印度经济时报主办的一场会议
亚马逊与Hexa达成协作，支持卖家创建3D图像
据亿邦动力消息，亚马逊和3D可视化公司Hexa达成一项新举措，...
属于王亚伟的时代一去不返
近日屡有传闻称，昔日“公募一哥”王亚伟已被监管部门带走调...
今头条！渤海化学：全资子公司渤海石化拟投建丙烯酸酯和高吸水性树脂新材料项目
渤海化学公告，全资子公司渤海石化拟投资建设丙烯酸酯和高吸...
上常从容与信言诸将能不文言文翻译通假字_上常从容与信言诸将能不,各有差翻译
想必现在有很多小伙伴对于上常从容与信言诸将能不,各有差翻译...
环球快看：信濠光电：公司暂未涉及上述VR、MR领域
同花顺金融研究中心6月7日讯，有投资者向信濠光电提问，请问...

智能

智联世界，元生无界！快手虚拟人IP亮相2022人工智能大会

2022-09-07 10:47:54
机器人界“奥林匹克”！2022世界机器人大会8月18日举行

2022-08-10 09:58:58
2025年全球人口将达到90亿！机器人将在农业领域大显身手

2022-07-14 09:41:10
中科院院士蒋华良：AI+分子模拟与药物研发将大有可为

2022-07-14 09:37:00
“千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕

2022-07-07 09:28:34

消费