企业站

请登录登录

昇思人工智能框架峰会 | MindSpore图模式多级编译易用性升级，让开发者好用易用

PConline 2025-12-24 12:43:13

企业频道厂商稿

由华为云驱动

昇思MindSpore开源社区将于2025年12月25日在杭州举办人工智能框架峰会，聚焦MindSpore Graph Mode易用性提升。2025年，该框架优化了@jit装饰器简化图模式切换，增强自定义编译能力并改进报错日志，助力开发者高效训练大模型。峰会汇聚业界专家，共探AI技术创新与应用。

据悉，昇思MindSpore开源社区将于 2025年12月25日在杭州举办昇思人工智能框架峰会。本次峰会将在昇思开发者动手实践workshop设立开发者动手实践体验，带领开发者体验使用昇思MindSpore大模型训练技术，欢迎现场体验，提出更多的易用性建议，本文对昇思MindSpore在开发易用性上的一些探索。

Graph Mode图模式作为MindSpore训练和推理加速的重要手段，其易用性提升一直是编译演进的重点和挑战。今年以来我们在Graph Mode易用性提升方面做了一些工作，下面我们来分别讲下。

将全局graph mode的配置优化为@jit使能编译加速

早期版本中，用户需通过mindspore.set_context(mode= GRAPH_MODE)手动切换图模式，这种方式存在一些易用性问题，例如：

• 入门门槛高，需要确保模型中所有nn.Cell的构图逻辑符合静态图语法约束。

• 设置与代码逻辑分离，用户可能不清楚模型中哪些部分实际是按静态图执行，哪些部分仍然按动态图执行。

• 用户需要记忆MindSpore context的特定mode枚举值。

将graph mode设置简化为装饰器@jit，是易用性提升的重要一步。这种设计遵循 “就近原则”，用户无需关注全局 context 配置，仅在需要graph mode加速的函数或网络定义前添加装饰器，即可快速启用编译。例如：

用户无需理解“context 全局静态图模式配置”的底层逻辑，通过“装饰器 = graph mode”的直观映射即可上手；同时支持局部graph mode启用，用户可针对性能瓶颈模块精准优化，避免全局graph mode带来的调试复杂度。此外，@jit装饰器兼容原有 context 配置逻辑，保障用户老代码的平滑迁移，实现易用性与兼容性的平衡。

"jit接口参数优化

早期版本中，jit的接口参数较为复杂，不乏一些用户难以理解的参数，跟业界常用的graph编译使能接口如torch.compile等有较大差异。基于此，我们对比了业界的一些参数配置，重新设计了jit接口的参数和实现了对应的功能。以下简单介绍常用的几个参数。

1、capture_mode参数，表示图捕获的方式。提供三种选项，分别为：

• “ast”：通过源到源的方式编译Python代码，先把Python源码解析成Python抽象语法树，然后把抽象语法树解析为MindIR。

• “bytecode”：解析用户代码的Python字节码，通过将Python字节码逐个映射为MindIR的节点，完成图捕获过程。对于无法转换为 MindIR 节点的Python字节码或操作，编译器提供了“裂图”的方式，直接走回Python解释器去执行，通过计算图和裂图结合的方式，支持了更多的Python语法范围。

• “trace”：在动态图执行过程中，通过记录动态图执行算子的轨迹，过滤出计算图。生成计算图后，后续的step可以不用继续通过动态图方式执行，而是直接执行计算图，以此来提升模型性能。

三种图捕获方式各有优劣，例如ast方式支持捕获动态控制流入图；bytecode模式对用户代码语法约束减少且提供Guard机制保证编译产物可复用；trace模式进一步减少对用户代码的语法约束，但是不支持动态控制流和动态shape。用户可根据实际场景灵活选择图捕获方式。

2、jit_level参数，控制图优化级别。提供两种选项，分别为：

• jit_level=O0：只做基本的图切分优化，以及算子选择（硬件相关），优点是可以保证IR图的原始结构，编译速度较快。

• jit_level=O1：增加图优化和自动算子融合，编译性能有所损失，但模型开始训练后，效率较高。

3、dynamic参数，控制是否开启自动动态shape功能进行编译。提供两种选项，分别为：

• 0：不进行动态shape编译

• 1：使能动态shape编译并自动检测shape的变化

除了自动检测shape变化的功能，我们还额外提供@enable_dynamic装饰器，搭配jit接口使用，让用户可以指定动态shape变化的轴和指定动态rank。

4、fullgraph参数，控制是否把整个函数捕获成图。对于用户代码中无法捕获成图的部分，如果该参数设置为False，则允许回退到host侧用动态图执行，能有效减少部分语法限制，降低静态图使用门槛；如果设置为True，则可以检查用户代码中无法入图的部分，指导用户修改代码，使整个函数可以全部被捕获入图，提升模型性能。

自定义能力增强

随着AI模型与硬件生态的日益复杂，开发者在追求极致性能与创新时，常面临一个问题，就是框架的默认优化策略与运行时无法充分释放专用硬件（如新型AI加速卡）的全部潜力。这种“框架通用性”与“业务/硬件特殊性”之间的鸿沟，限制了技术落地的深度与效率。我们重点围绕自定义PASS、自定义后端两个维度，为开发者提供了更灵活、高效的框架扩展机制。

1、自定义PASS

MindSpore开放了框架pass编写及注册接口，用户可通过编写并注册自定义PASS插入自定义图优化逻辑，在编译期对计算图进行变换：

• 开放PatternToPattern Pass父类及必要的工具方法，用户可以通过继承PatternToPattern Pass，实现源pattern、目标pattern、额外匹配条件等pass逻辑，实现计算图变换优化目标。

• 提供自定义Pass注册接口register_custom_pass，用户可以根据需要选择不同后端、不同阶段注册相关自定义pass。

2、自定义后端

MindSpore开放了后端编译执行扩展接口，允许用户适配第三方后端：

• 提供后端编译执行、后端管理等核心模块的抽象层，允许用户自定义编译执行行为。

• 支持用户自由切换不同后端进行编译执行。

具体使用方法参考链接：https://www.mindspore.cn/tutorials/zh-CN/master/custom_program/custom_backend.html

MindSpore框架通过增强自定义能力，显著提升了框架的开放性与可扩展性。开发者能够针对特定算法、硬件或场景，灵活定制计算逻辑、优化策略与运行时支持，从而在保持框架统一性的同时，充分发挥软硬件协同潜力，加速AI应用创新与落地。

报错日志信息优化

关于静态图报错日志信息的优化工作，也在持续开展，其中我们重点优化了Tensor重载接口的报错日志信息。例如对于如下的程序：

优化前的报错日志信息如下：

该报错日志信息没有明确接口是如何使用错的，只是把重载的函数全部列出来，让用户自己去体会。

而优化后的报错如下：

优化后的报错日志信息会把出错的原因打印出来，而且加上波浪线指示出具体有问题的代码位置。

后续演进方向思考

易用性的提升仍然是MindSpore Graph Mode后续演进的重点方向。我们围绕下面几个点来展开：

1、多级编译的分层解耦

当前用户调用被@jit装饰的函数时，MindSpore会对这个函数进行前端图编译（图捕获、硬件无关优化等）、后端图编译（算子选择、硬件相关优化等）和图执行等一系列操作，最终只把计算结果返回出去。但用户可能有以下诉求：

• 调用被@jit装饰的函数出现报错时，需要知道报错在哪个阶段，这个信息有可能帮助用户进行问题定位。

• 把前端编译的IR图、后端编译的IR图和最终算子的执行序列打印出来，方便做网络调试。• 进一步地，用户可能想通过调用MindSpore提供的Python接口，就能实现修改前端或后端编译生成的IR图或算子执行序，以简单地实现模型定制优化。

这些诉求可以通过将jit装饰的函数调用分解为前端编译、后端编译、图执行等阶段的接口调用来实现，用户可以分别调用各个阶段对应的接口，得到不同阶段的产物，再调用这些产物提供的改图或者调试接口。例如：

2、自定义能力增强

为了满足用户深度定制模型优化的需求，框架需要提供更强的自定义能力，例如：

• 扩展自定义Pass功能，支持对整图（包括控制流子图等）的修改，除了算子融合，用户可以以此来实现一些算子执行序的调优，如通算掩盖等。

• 提供通用图优化、算子融合优化等的配置功能，让用户可以自行选择需要执行的优化Pass，而不是框架默认地把所有的优化都执行。

3、报错日志信息持续优化

报错信息的优化是Graph Mode编译易用性提升的重点和挑战，Graph Mode除了运行时错误，比动态图还多了编译期的错误，如语法不兼容、图结构非法等，这种错误往往较难定位根因。尽管Graph Mode的报错信息已实现大幅优化，但仍面临三大核心挑战：

1.信息过载与简洁性的平衡：高级开发者需要详细的底层日志，而新手开发者可能被过多信息困扰，如何根据用户需求动态调整报错信息的详略程度，是一大难题；

2.特殊场景覆盖不足：对于那些使用频率低、场景特殊、图结构复杂的“小众报错场景”，缺乏完善的易懂性引导，仍依赖底层技术日志，导致开发者调试成本高。

3.上下文分析的准确性：复杂模型中，报错的根因可能与报错位置不直接相关（如上游张量shape错误导致下游算子报错），当前上下文分析能力仍需提升，避免 “治标不治本”。

后续我们还是围绕上面几大挑战来持续优化报错日志信息，也欢迎广大开发者给Graph Mode报错反馈问题和提供宝贵意见。

2026年我们将重点对API/模型接入做大模型生成技术的探索，若对昇思MindSpore的易用性提升，开发者体验提升感兴趣，可以关注昇思MindSpore开源社区：https://gitee.com/mindspore/docs

本次在杭州举办的昇思人工智能框架峰会，将会邀请思想领袖、专家学者、企业领军人物及明星开发者等产学研用代表，共探技术发展趋势、分享创新成果与实践经验。欢迎各界精英共赴前沿之约，携手打造开放、协同、可持续的人工智能框架新生态！

点击展开全文

网友评论

聚超值推荐

更多优惠

极空间私有云T2S 8核双盘位便携全固态AI NAS网络存储内置UPS户外旅游vlog数码运动智能云服务器 满1800减180 ￥2119 ￥2199

比苛碳性干电池适用遥控器挂钟鼠标(5号20粒+7号20粒)组合套装 ￥16.9 ￥30.9

韶音（SHOKZ）【国家补贴】OpenFit Air T511开放式蓝牙耳机挂耳式不入耳运动跑步无线耳机玄武黑 券后省0.9 ￥538.2 ￥598

路先行有线转无线carplay盒子车载导航车机互联盒子奔驰大众奥迪宝马【迷你款】无线CarPlay-USB接口款 ￥127.2 ￥159

八位堂（8BitDo）猎2真无线NS版游戏手柄Switch2双切扳机ns2 TMR摇杆三模PC电脑Steam塞尔达无双宝可梦传说丝之歌 券后省0.9 ￥269.1 ￥299

drop dot【66W超级快充丨线加粗80%】数据线三合一6A苹果安卓充电器线Type-C一拖三多合一华为小米手机车载 1.2米【编织线】黑色 券后省20 ￥19.9 ￥39.9

极度未知（HYPERX）飓风2飓风3电竞游戏耳机头戴式有线无线电脑FPS吃鸡ps5专用耳麦适配三角洲行动无畏契约【飓风2黑红】金榜精选丨职业爆款 满1000减20 ￥449 ￥469

倍特源【3C认证丨可上飞机火车】自带4线充电宝大容量小巧迷你移动电源快充第一名适用苹果小米20000 蓝色【国产芯片+自带线】3C认证丨可上飞机【国家3C认证丨可上飞机】推荐顶配版 券后省30 ￥29.4 ￥59.4

券后省30 ￥169 ￥249

昇思人工智能框架峰会 | MindSpore图模式多级编译易用性升级，让开发者好用易用

网友评论

聚超值推荐

相关推荐