
IT之家 12 月 3 日音问,在 11 月底的 2024 中国信息通讯大会“算力辘集算网一体改变发展论坛”上,中国出动相干院副院长段晓东联袂天数智芯、壁仞科技、中兴、海光、瀚博等产业互助伙伴开云体育(中国)官方网站,发布了“芯合”异构搀杂并行施行系统 1.0。 据先容,“芯合”异构搀杂并行施行系统具备基于非均匀贪图任务切分 ITD(Inhomogeneous Task Distribution)算法的 3D 并行计谋和基于 GDR(GPU Direct RDMA)的异构芯片高速通讯两大中枢才

IT之家 12 月 3 日音问,在 11 月底的 2024 中国信息通讯大会“算力辘集算网一体改变发展论坛”上,中国出动相干院副院长段晓东联袂天数智芯、壁仞科技、中兴、海光、瀚博等产业互助伙伴开云体育(中国)官方网站,发布了“芯合”异构搀杂并行施行系统 1.0。

据先容,“芯合”异构搀杂并行施行系统具备基于非均匀贪图任务切分 ITD(Inhomogeneous Task Distribution)算法的 3D 并行计谋和基于 GDR(GPU Direct RDMA)的异构芯片高速通讯两大中枢才气。
基于 ITD 算法的 3D 并行期间可通过通用搀杂施行框架竣事异构数据并行、异构活水线并行,竣事数据微批次大小、数目、活水线并行度等参数在异构算力上的自得当调理;
基于 GDR 的异构芯片高速通讯期间可在不改变芯片原有通讯接口基础上,通过界说数据传输架构、经过及接口圭臬,屏蔽底层硬件相反,竣事顶层施行任务在异构算力集群上散播式通讯的无感拆解。
中国出动浮现,现时,系统已竣事百亿参数大模子在英伟达、天数智芯、壁仞科技、海光等 4 家智算芯片上的交叉搀杂施行,限制可复古万卡集群,施行加快比达 95% 以上,达到“业界超过水平”,夙昔将在进步智能算力资源期骗率及促进国产算力发展等方面线路着急作用。
此外,中国出动联袂华为、瀚博、澎峰、海光、天数智芯等产业互助伙伴在论坛上发布了智算“芯合”算力原生基础软件栈 2.0。
IT之家查询公开贵府获悉,中国出动于 2023 年研发并发布“芯合”算力原生基础软件栈 1.0,初次竣事智算应用一键式跨芯迁徙的指标,已在山东、广西等多省市的路桥检测、智能安防等场景试点应用,杜撰智算应用向国产化芯片迁徙的复杂度。
“芯合”基础软件栈 2.0 相较于之前竣事了三大升级:
一是才气升级,全面重构算力空洞模子,插件化生动接入英伟达、华为、海光等 6 家 AI 芯片,拓展 ONNX、SYCL 等更多编程范式,复古泛 AI 应用的跨芯迁徙。
二是性能升级,新增对标 CUDA 的 DNN、BLAS 等高性能贪图库,提供图算会通编译优化才气,竣事性能大幅进步,现时应用跨架构迁徙损耗已杜撰至 10% 以内。
三是限度升级,构建面向智算应用的“跨架构软件工场”,提供长入设置、调试、优化、部署、迁徙全人命周期职业才气,杜撰应用设置、上线期间,进步举座研发限度。
中国出动浮现,现时,“芯合”算力原生基础软件栈 2.0 已竣事泛 AI 应用在英伟达、英特尔、华为、瀚博、天数智芯、海光 6 家智算芯片间的一键式跨芯流转迁徙,源源逶迤限度 > 95%,迁徙性能损耗 < 10%,迁霎期间 < 20s,已具备限制商用条目,夙昔将在进步智能算力辘集自主可控水平日面线路着急作用。
告白声明:文内含有的对外跳转贯穿(包括不限于超贯穿、二维码、口令等时势),用于传递更多信息,节俭甄选期间,限度仅供参考开云体育(中国)官方网站,IT之家通盘著作均包含本声明。
声明:新浪网独家稿件,未经授权退却转载。 -->