MindFormers:一套全面的大模型训练和部署开发工具

MindSpore Transformers套件—一个全面的大模型训练和部署开发工具,支持业界主流的Transformer预训练模型与SOTA下游任务。
直达下载
回到上一页
clickgpt_line.png_noView
介绍

MindSpore Transformers,简称MindFormers,是一套全面的开发工具,旨在支持大型模型的训练、微调、评估、推理到部署的全过程。该套件特别针对业界流行的Transformer类预训练模型,支持SOTA(State of the Art)的下游任务应用,并提供了多样的并行运算特性。

MindFormers特色功能

  1. 一行代码切换:用户可通过简单的一行代码实现从单卡到多卡甚至是大规模集群的训练模式切换。
  2. 并行配置个性化:根据具体需求,用户可以灵活设置并行配置,实现数据与模型的最优并行策略。
  3. 拓扑感知:自动感知硬件拓扑,有效整合数据并行与模型并行策略,提升运算效率。
  4. 组件化配置:支持自定义配置诸如优化器、学习策略等模块,灵活应对不同训练需求。
  5. 高级接口:提供Trainer、pipeline、AutoClass等高阶易用接口,简化开发过程。
  6. 权重管理:支持预置SOTA模型权重的自动下载与加载,便捷用户实验与部署。
  7. 平台兼容性:完善的计算中心迁移部署支持,确保从实验到生产的无缝过渡。

安装与配置

MindFormers支持多种安装方式,包括源码编译和Docker镜像安装。源码安装适合需要自定义修改或者想要了解底层实现的用户,而Docker镜像安装则更加快捷方便。

  • 源码编译安装

        
    git clone -b dev https://gitee.com/mindspore/mindformers.git
    cd mindformers
    bash build.sh
    
  • Docker镜像安装

        
    docker pull swr.cn-central-221.ovaijisuan.com/mindformers/mindformers0.8.0_mindspore2.2.0:aarch_20231025
    

快速上手

MindFormers提供了灵活的使用方式,包括使用脚本直接启动训练或通过API调用进行更高级的操作。

  • 脚本启动训练

        
    git clone -b dev https://gitee.com/mindspore/mindformers.git
    cd mindformers
    # 修改相应的配置文件后
    bash scripts/run_distribute.sh RANK_TABLE_FILE CONFIG_PATH [0,8) train
    
  • API启动: 使用Trainer接口可以轻松进行模型的训练、微调和评估。

        
    import mindspore
    mindspore.set_context(mode=mindspore.PYNATIVE_MODE, device_id=0)
    from mindformers import Trainer
    
    cls_trainer = Trainer(task='text_generation', model='gpt2', data_path='your_data_path')
    cls_trainer.train()
    

MindSpore Transformers套件为AI研发人员提供了一个强大、灵活且高效的开发环境,支持从模型训练到部署的全流程,助力用户在AI领域的创新和应用。

RPA
八爪鱼RPA
支持一键抓取公众号/小红书/抖音/淘宝数据
立即查看
流程自动化
付费
AI爆文训练营
图文变现友好赛道,低门槛、高上限,教你从0到1做个赚钱的公众号!
立即查看
躺着赚钱
¥149/年
何老师陪你做副业
这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔,只分享有价值的副业项目。
立即查看
AI赚钱案例
限免
DeepSeek进阶教程
带你全面掌握DeepSeek应用技巧。提升工作、学习效率
立即查看
100万人学过
付费
网盘拉新实战教程
每周花费一小时,手把手教你赚网盘平台佣金
立即查看
500人学过
限时优惠
AiPPT
结合最新AI技术,为用户提供一键生成高质量PPT的解决方案。
立即查看
一键生成 PPT
免费
豆包MarsCode
一款免费的AI编程助手,全新支持DeepSeek R1/V3、豆包大模型1.5自由切换,免部署、更准确、更强大!
立即查看
AI编程助手
免费
Monica AI
Monica AI满血复活DeepSeek【免费】,提升您的聊天、搜索、写作和编程体验。
立即查看
一站式 AI 助手
云服务
腾讯云
综合性的云计算服务平台,现已接入DeepSeek,提供多样化的云解决方案
立即查看
高效可靠
云服务
阿里云
全球领先的云计算与数据服务平台,提供云服务器、存储、数据库、安全等多种服务
立即查看
多样化
编程学习
免费领取编程学习资料