华为宣布开源CANN,对标英伟达CUDA
来源:倍可亲(backchina.com) 专题:华为最新动态!专题:抄底还是跑路?美股最新动态
北京时间8月5日,在华为(专题)举办的昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发。
CANN的全称是“神经网络异构计算架构”(Compute Architecture for Neural Networks),它的角色,是把上层AI训练框架(如PyTorch、TensorFlow、MindSpore等)和底层昇腾芯片连接起来的桥梁,让开发者不用关心芯片细节就能调用底层算力。
几乎每一家算力卡公司都有类似的架构。最知名的是英伟达的CUDA和AMD的ROCm,在国内市场,有摩尔线程的MUSA、壁仞科技的BIRENSUPA、寒武纪的Neuware和海光信息的DTK等等。
英伟达CUDA与GPU和NVlink构成英伟达的核心护城河,如今英伟达的计算卡之所以在全球热销,与CUDA软件系统生态的完善有着直接的关系。一旦用户想要从英伟达的计算卡体系迁移到其他品牌的体系中来,面临的问题是开发者必须重写大量代码,使用生态相对不成熟的替代库,同时也会失去英伟达围绕CUDA建立起来的庞大技术社区的支持。
华为在7月底的WAIC上展示了昇腾384超节点真机,这座由12个计算柜+4个总线柜构成的庞然大物,它拥有300 Pflops的算力,269TB/s的网络带宽,1229TB/s的内存带宽。
而随着今天华为正式宣布开源CANN架构,意味着未来所有的开发者可以更好的利用昇腾计算卡配合、CANN建立的计算生态和华为自研深度学习框架MindSpore,建立华为昇腾的AI软硬件一体化方案,以对标以英伟达为中心的PyTorch+CUDA。
根据华为公开资料显示,CANN目前升级到8.0版本,新增200多个深度优化的基础算子、80多个融合算子、100多个Ascend C API,典型算子开发周期从2人月缩短至1.5人周,同时,支持图模式能力扩展库,提升PyTorch在昇腾上的大模型推理性能。
截至目前,CANN已支持包括PyTorch、MindSpore、TensorFlow、飞桨、ONNX、计图、OpenCV和OpenMMLab等深度学习框架与第三方库。
相比英伟达CUDA的闭源,此次CANN开源,华为无疑希望尽快通过开发者的合力共创,快速扩大CANN生态圈,让昇腾的计算卡不但在硬件上有计算能力,也要在软件上快速的弥补短板,真正意义上赶超英伟达。