适配超20＋芯片厂商，昇思MindSpore大模型之路走南闯北

机器之心原创

作者：泽南

上周科技领域这场备受关注的大会，展示的都是前沿 AI 应用。

(资料图片)

利用神经网络求解，在中科院大连化学物理研究所，以前用超算也无法完成的水分子运动方程计算效率提高了 1000 倍。‍

通过跨模态统一表征学习，中科院自动化所和武汉人工智能研究院联合打造的「紫东太初」2.0，让大模型第一次进入了全模态时代，同时支持多轮问答、文本创作、图像生成、3D 理解、信号分析等任务。

在 6 月 16 日的人工智能框架生态峰会 2023 上，我们见证了科学和 AI 领域的一系列技术突破，这些进展的背后都是 AI 框架昇思 MindSpore 在提供支持。

人工‍智能的发展正在催生出前所未有的应用，AI 框架的重要性逐渐凸显，而在这个过程中，昇思已成为很多公司机构的 AI 基础设施。

在峰会现场，昇思生态的参与者们公布了围绕 AI 框架生态的一系列合作，包括但不限于：启动上海昇思 AI 框架和大模型创新中心、发布「共建人工智能框架生态，繁荣中国人工智能产业」联合倡议、成立昇思 MindSpore 开源社区理事会。

还有新技术和新方向，昇思的 2.0 正式版在易用性、生态兼容和 AI for Science 等方面有了里程碑式的提升。

其中最引人关注的，是事关 AI 算力的重要一步：走南向。

实现「多芯一生态」

我们知道，AI 框架在人工智能技术构建的流程中承担着「操作系统」一样的关键角色。它集成了算法封装、数据处理、计算资源调用等能力，面向开发者提供方便的开发界面和高效的执行平台，是现阶段 AI 算法开发的必备工具。

昇思 MindSpore 在机器学习开发的过程中起到上承应用、下接芯片的桥梁意义。

为了持续拓展连接的广度，AI 框架需要向两个方向不断延伸：「南向」为 AI 芯片算力带来标准化，「北向」与开发者和算法厂商开展技术联创，围绕场景创新、重要需求创造更多可能性。

在生态峰会上，昇思宣布了「南向」的新进展：昇思已兼容适配 20 余家芯片厂商伙伴的硬件设备，打通云端智能、边缘智能、端侧智能，实现端边云全场景协同。现在，昇思已经让智能无所不在。

统一生态是昇思一直以来努力的目标。通过兼容不同架构、不同厂商的算力，昇思现在可以在 AI 框架的层面上实现统一、无感知的调用，而无需担心硬件适配能力，这种能力覆盖 NPU、GPGPU、CPU 等主流计算架构。对开发者来说，昇思从开发界面、框架能力等多个方面都做到了统一视角，应用可以同时在多种硬件后端之间平滑迁移。

实际的应用效果如何？现在在云上环境中，开发者的同一套脚本可以不受资源限制地使用，比如可以先用 GPU 进行训练，当 NPU 资源可用时，不进行脚本修改就能直接切换至 NPU 继续训练。对于端侧的 AI 应用，昇思可以将云侧训练的模型无缝部署到端侧进行推理。

这种能力大幅降低了 AI 开发的门槛。面向异构算力，通过昇思提供的标准南向接口与算子集，开发者可以让整体芯片使能周期大大缩短，无需再进行全量重新开发。同时借助于框架的公共能力，如自动并行、自动微分、模型导出等，我们在新硬件上也能快速完成 AI 应用的开发、训练、推理全流程。

通过软硬件垂直整合方式搞优化，融合不同算力，还让它们都能发挥出最大能力，昇思所做的事在 AI 框架上属于意义重大，但难以实现。让算力在 AI 框架层面上实现统一面临很多挑战：首先，不同架构的芯片在算力配比、通信能力、内存规格等方面都有一定差异，而要充分发挥芯片算力，要解决算子执行效率、存储、运行时调度优化等问题。

从技术架构上，昇思 MindSpore 为支持多硬件统一也做了不少事，包括：

实现后端架构的解耦，快速支持新芯片插件化对接，包括支持第三方自定义图优化 Pass 注册，屏蔽资源管理细节，及驱动层接口注册；支持抽象硬件类型建模，让对接流程实现标准化；支持抽象算子封装，统一了算子接口，支持多平台算子库动态注册，框架层实现异构算子选择；支持第三方图 IR 接入，以充分发挥芯片的架构优势。公共组件实现跨硬件复用，如内存复用算法、内存池实现、统一运行时等。

现在，开发者用同一套脚本就可以在多个硬件后端上执行 AI 任务，无需做面向硬件的修改。另外，框架的能力，如自动并行、自动微分、融合优化等都是基于统一 IR 来构建的，因此可以在多个硬件后端上进行复用，也无需芯片厂商进行重新适配。

面向异构的执行环境，如 CPU+GPU、CPU+NPU 等，昇思的统一 IR 支持做异构的子图切分，不同的子图可以下发到不同的异构硬件上执行，这些异构切分可以由框架自动完成，同时也支持用户手动指定执行硬件。

昇思的目标很明确：做 AI 应用和异构算力间的桥梁，降低开发者使用算力的门槛，让芯片算力能够触及更多的开发者和应用场景。通过大力发展「南向」，昇思帮开发者解决了核心问题，也可以实现更大规模的并行化，例如跨算力中心的协同计算和异构计算，这无疑会大大加速大模型等技术的应用。

另一方面，通过连接昇思这一流行 AI 框架的生态，国产化 AI 算力在这一过程中也能被更好地应用起来。

做业界领先的 AI 框架

自 2020 年 3 月发布首个版本以来，昇思作为业内瞩目的 AI 框架经历了快速发展。围绕昇思的社区，已是国内最具创新活力的 AI 开源社区。

过去十年，AI 领域经历了从技术突破到应用落地的阶段转换，众多科技公司、研究机构发布 AI 框架，但只有少数成为了主流，其中既包括 TensorFlow、PyTorch、JAX 等国外框架，也有昇思 MindSpore 和飞桨这样的国内佼佼者。

科研论文数量是衡量创新能力的重要指标，基于 MindSpore 的顶会论文如今已超过 900 篇，据 Papers with Code 统计，2022 年使用 MindSpore 的顶级会议论文在国内 AI 框架中排名第一，全球范围内仅次于 PyTorch，位列第二。

昇思的开源生态汇集了超过 1.3 万贡献者，通过超 10 家高校参与的社区模型众智活动，目前其平台已有超过 400 个主流模型，这些成果不断推动着 AI 能力的全场景应用，有超过 5500 家企业应用了昇思能力实现了智能化技术落地。

可以说，昇思训练 - 推理 - 全场景协同、全流程降低开发门槛、全架构统一的三大愿景已在逐步实现。从地球系统模拟、自动驾驶，到预训练大模型训练，再到蛋白质结构预测，各行业的开发者在昇思上实现了 AI 开发自由，不断推动着技术创新和应用落地。

在 2.0 的大版本更新上，昇思在大模型能力、科学计算和 AI 技术落地上继续实现大幅改进。

目前行业内的新需求是生成式 AI 落地，在这方面昇思有自己的独特优势：三年前首版本发布时，昇思主打的就是面向大模型的自动并行特性。作为一款 AI 框架，昇思将大模型开发的系统工程难题集成到软件框架中解决，沉淀出了整套从预训练到场景应用的大模型实践方案。

首先是基础模型，昇思社区开源了超过 15 个基础预训练模型以及训练脚本，包括当前最具备代表性的 BLOOM，LLaMA 等。人们可以方便地以此作为基础，然后通过昇思 2.0 正式推出的大模型全流程解决方案完成从开发 - 训练 - 微调到部署的全过程。

以 LLaMA 模型为例：在脚本开发阶段，从 Transformer 模型库中一键导入 LLaMA 并调用 Trainer 高阶 API，你只需要十行代码就能完成算法脚本的开发。在训练阶段，如果算力有限，昇思可以通过异构与存储优化技术实现基于一台服务器，八张训练卡支持千亿参数大模型训练。

而面向大规模集群方案，昇思原生了支持业界最完善的 9 种数据和模型并行模式，以及断点续训等高可靠方案，算力资源利用率比业界水平要高 15%。

进入场景微调阶段，昇思 2.0 通过集成多种低参微调的算法，如 LoRA，Adapter 等，可实现一行代码运行 LLaMA 的低参微调，也支持千亿级模型进行 RLHF。

在推理部署阶段，昇思提供模型压缩工具，结合不同的硬件能力，支持模型规模 5~20 倍压缩，同时精度损耗小于 0.5%，并且支持异构及多级存储优化的能力，单卡推理规模提升至千亿。

过去三年，昇思社区帮助业界完成了紫东。太初、鹏程系列等百亿、千亿级大模型，根据《中国人工智能大模型地图研究报告》中的数据，基于昇思孵化的产业落地大模型，占到国内总数的 40%。

除大模型之外，昇思也一直在推动 AI 使能科学计算，并积极推动进一步降低 AI 应用门槛，针对行业重点场景，打造了系列场景化开发套件。通过与启智 OpenI 社区联合打造的 MS-Adapter 项目，昇思在保留原生 API 能力的同时，实现了业界主流框架 Pytorch 大多数 API 的兼容。

MindSpore 生态的未来

简单来说，通过昇思 MindSpore 业界领先的能力，大模型可以更快落地，更多行业可以实现智能化重塑。

在 AI 领域，新技术的探索让我们找到未来方向，而 AI 框架可以帮助我们将技术转化为生产力。昇思已为我们铺好了路，通过提供开箱即用的套件，它正在满足各领域开发者的需求。

通过一系列共建与合作，昇思正在不断完善生态伙伴体系和「朋友圈」，基于 AI 框架的多芯一体生态还会不断壮大。

未来，昇思还将持续提升框架的易用性，兼容业界生态，降低开发者编程门槛。在技术上进一步提升自动并行的核心能力，实现大模型从训练到推理部署的端到端闭环。

昇思 AI 框架，将会成为更多行业的首选。

推荐内容

适配超20＋芯片厂商，昇思MindSpore大模型之路走南闯北

热热热！这几个避暑胜地你一定不能错过 今日热搜

王思聪乘私人飞机带一群网红购物！新女友颜值不输明星

在现场|借后奥运经济东风 推广张家口特色产品-今日报

多图剧透！小石探访西山永定河文化节开幕式彩排现场——

苹果Vision Pro，能否助推XR+医疗起飞？

2023年武汉低保标准再次提高！具体提高到多少？申请条件是什么？-世界今头条

官宣！伦纳德再做手术，快船陷入绝境，NBA休赛期急需进行大交易|世界快看点

高活跃股全名单，最火筹码换超6遍！成交额连续提升股稀缺，3股市盈率不到30倍|全球速看料

“福海粮仓”生机勃勃 环球快消息

银川烧烤店燃气爆炸事故原因公布

瓦格纳集团称“内战已经正式开始”-当前热门

eat out for dinner_eat out-环球头条

焦点消息！山中留客表达了作者什么样的思想感情（山中留客表达了作者怎样的感情）

世界讯息：鲭科_关于鲭科简述

桂林草莓音乐节动感开幕！打造文旅融合新场景

教师节古诗词祝福语（教师节古诗词祝福语三年级上册） 焦点快看

热消息：2023万里茶道——环中国自驾游集结赛鹤峰站开赛

邀请你加入“创伙伴们的创业星球”

环球观天下！加量还降价 6月28日蔚来旗舰ES8正式交付：49.8万元起

端午假期前二天 河南接待游客超904万人次 旅游收入超39亿元 焦点信息

【环球热闻】毛利率堪比茅台 研发人员仅8人 敷尔佳上市引争议

每日热文：世界热点！直线符号怎么打_直线符号|焦点滚动_世界视讯

高质量发展看中国|“湘”村振兴：一只小兔子“蹦”出三亿元大产业

西藏铁路网络图_西藏铁路网_环球观速讯

【天天快播报】涉腐败问题 巴黎奥组委总部遭法国警方突击搜查

参考消息特稿 | “千万工程”20年实践激发世界回响

全球微动态丨建滔集团（00148.HK）：6月23日南向资金增持4000股

观花船、穿汉服、买香囊……端午假期带你沉浸式夜游古镇

特斯拉承诺今年将投放Cyber​​truck

WTI原油跌破68美元/桶 日内跌2.28% 环球动态

环球热门:黑猫警长一共几集_童年的回忆

工地塔吊图片（塔吊图片）_世界热资讯

世界看点：果然视频｜高温来袭，不想中暑？消防员有妙招

【当前热闻】农业大数据是干什么的（农业大数据）

环球头条：“泰坦”号深潜器或于下潜当天失事

火炕可以烧煤吗_睡炕烧煤危险吗

罗马诺：法比奥-卡瓦略将租借加盟莱比锡一年，无买断条款

渣打集团(02888)6月22日斥资约294.75万英镑回购43.93万股

环球今头条！绿色的水果有哪些东西_绿色的水果

有肉有情节的小说一对一 有肉有情节的小说一对一-最新消息

倍耐力轮胎质量怎么样啊（倍耐力轮胎质量怎么样）|观天下

全球热头条丨家族财富_关于家族财富介绍

端午前一天暴饮暴食，乘客高铁上腹痛倒地，这位博士后的针灸帮了大忙-当前热门

唐朝皇帝为何无视赵云黄忠马超，但把诸葛亮当名将供奉？

超清小品下载网站_小品下载网 当前观察

播报：九大高原湖泊入湖河道保护拟全面实行河长制

【楼建军】刘阿姨的粽子——健康过端午|世界今头条

郑州市气象台继续发布高温橙色预警信号 今日热讯

天天速讯：康龙化成将于8月18日派发末期股息每10股3元

适配超20＋芯片厂商，昇思MindSpore大模型之路走南闯北

周生生铂金多少钱一克（2023年06月25日）参考价格

环球热头条丨创新与融入，卡塔利亚的线上线下俩手抓战略

经销商拍卖揭晓 5 月份最赚钱的 10 款汽车

车厘子多大_1j车厘子多大

封神中，阐教十二金仙落入三霄之手后，为何都能保全性命？

天天简讯:完美世界：“黄粱一梦”，一梦一世，石昊获得皇道龙气加身！

全球今头条！斗破：萧炎单挑2个五星斗王，八极崩打爆林修崖，一拳打废劈棺爪

青州市人力资源和社会保障局在哪_青州市人力资源和社会保障局

2023年熊猫金币5枚套装价目表（2023年06月25日）

震惊!卡梅隆谈泰坦号事故：与泰坦尼克号悲剧相似

长三角铁路端午小长假三天发送旅客超900万人次_通讯

AMD苏姿丰将于7月抵台举办新品发布会、拜访当地供应商

唐昊继承昊天宗2块魂骨，独孤博养出1块魂骨，得知尘心魂骨数，唐三傻眼！ 世界最新

斗罗竟成有生之年系列，鹅厂决定全系动画化，为何独缺了斗五？ 每日热点

封神中，蓬莱岛三仙羽翼仙、法戒、余元相比较，究竟谁更厉害？ 世界热头条

环球即时看！《紫川》帝林：我本是地狱修罗，奈何困于人间情义

封神中，陆压用斩仙飞刀杀余元时，为何要先拜昆仑山？

环球热资讯！斗破苍穹年番大结局公布，萧炎回到加玛帝国，三上云岚宗还没消息

环球热门:不定期的战队玩具开发者日志概要（2023.06.23）——纪念版破里剑变身轮的外包装公开！

《哆啦A梦：大雄与天空理想乡》观影有感 全球观速讯

完美世界：石昊功力散尽，石崇沦为傀儡，小世界中究竟隐藏了什么|每日热文

斗罗：天梦冰蚕为何不产生魂骨？魂骨算什么，多加一个武魂才厉害

《凡人修仙传》动漫有几部？九元道祖为什么放了韩立？

微视频｜大地诗篇_环球简讯

《难哄》女主经历了什么？桑延怎么知道温以凡的过去的？

每日讯息!武汉今明两日 阵雨不时光临

天天热消息：内蒙古阿拉善盟市场监管局组织开展“2023清风行动”

《偷偷藏不住》段嘉许家境怎么样？ 段嘉许桑稚结局是什么？

热热热！这几个避暑胜地你一定不能错过今日热搜

在现场|借后奥运经济东风推广张家口特色产品-今日报

“福海粮仓”生机勃勃环球快消息

教师节古诗词祝福语（教师节古诗词祝福语三年级上册）焦点快看

端午假期前二天河南接待游客超904万人次旅游收入超39亿元焦点信息

【环球热闻】毛利率堪比茅台研发人员仅8人敷尔佳上市引争议

【天天快播报】涉腐败问题巴黎奥组委总部遭法国警方突击搜查

特斯拉承诺今年将投放Cybertruck

WTI原油跌破68美元/桶日内跌2.28% 环球动态

有肉有情节的小说一对一有肉有情节的小说一对一-最新消息

超清小品下载网站_小品下载网当前观察

郑州市气象台继续发布高温橙色预警信号今日热讯

唐昊继承昊天宗2块魂骨，独孤博养出1块魂骨，得知尘心魂骨数，唐三傻眼！世界最新

斗罗竟成有生之年系列，鹅厂决定全系动画化，为何独缺了斗五？每日热点

封神中，蓬莱岛三仙羽翼仙、法戒、余元相比较，究竟谁更厉害？世界热头条

《哆啦A梦：大雄与天空理想乡》观影有感全球观速讯

每日讯息!武汉今明两日阵雨不时光临

《偷偷藏不住》段嘉许家境怎么样？段嘉许桑稚结局是什么？

三省五市共护南水北调中线水源地快资讯

仙佑膏药注重环保和健康成品牌商进入市场快捷方式

热热热！这几个避暑胜地你一定不能错过今日热搜

比周琦还猛！17岁国产魔兽打爆世界杯，姚明欣慰，男篮或重返巅峰每日精选

环球热消息：谷歌投诉微软锁定客户微软将遭到FTC投诉

宝可梦同人：伦琴猫超级进化变成闪电咆哮虎，而他还不如不进化视讯

斗破：萧炎单挑2个五星斗王，八极崩打爆林修崖，一拳打废劈棺爪天天热文

迪迦奥特曼：三千万年前奥特曼们变成石像，为什么加坦杰厄还活着？全球报道

为什么包皮会痒_为什么包皮很痒视点

假面骑士Geats：最狠掰断手指变身，最终将军登场，二骑打爆四骑焦点热闻

《紫川》帝林：我本是地狱修罗，奈何困于人间情义环球实时

环球观速讯丨2023端午档总票房破9亿《消失的她》超5亿夺冠

在现场|借后奥运经济东风推广张家口特色产品-今日报

隆基李振国：大力支持可再生能源制氢扩大绿氢应用规模天天关注

每日时讯!恐龙有哪些种类恐龙的种类

假面骑士geats：景和将击杀麻雀，351和呱呱变身怪人，景和想要茨姆莉女神化，42话预告全球短讯

产教融合结硕果校企合作谱新篇青岛工程职业学院增材制造生产性实训基地揭牌仪式圆满举行

文明的坐标｜“徽韵留存”徽州古城|天天最资讯

当基层党员干部遇上端午假期，固始郭陆滩镇扎实做好端午假期各项重点工作时快讯

环江：强化源头治理提升农产品质量安全水平_全球要闻