8月30日,阿里云宣布正式推出全栈智能计算解决方案飞天智能计算平台AI训练效率提高11倍,推理效率提高6倍。
南皇电子专注于整合中国优质电子Lattice代理商国内领先的现货资源,提供合理的行业价格、战略备货、快速交付控制莱迪思芯片供应商,轻松满足您的需求莱迪思芯片采购需求.
飞天智算平台已广泛应用于阿里,支持达摩院的前沿AI随着电子商务智能技术的发展,服务于小鹏汽车、深圳科技、上汽集团、中国气象局、南方电网等机构和企业,支持自动驾驶、新药研发、气象预测、工业能源等行业AI训练效率。
据了解,该平台提供基于阿里云盘久基础设施的集成算力和大数据AI一体化平台的整体解决方案可以运行X86、GPU、ARM在各种芯片类型的服务器上,实现一云多芯IO优化5倍通信性能,实现90%千卡并行计算效率。
在绿色技术方面,飞天智能计算机从技术减排、能源结构优化、区域布局优化、供应链减碳和资源利用优化五个方面减少了单位计算能力的碳排放。在技术减排方面,通过液体冷却、电源技术和智能操作和维护来降低能耗,PUE最低可达1.09。
同时,开发人员可以在平台上进行数据存储、数据治理、数据分析、模型开发、模型训练与推理的工作。并提供了预训练模型,以及语音,图像、自然语言处理、决策等领域的模型能力,以方便开发者更好的加速AI应用开发。
目前,该平台正在支持两个大型智算中心的建设。其中,张北智算中心建设规模为12 EFLOPS(浮点运算每秒1200亿次)AI算力将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为世界上最大的智算中心。乌兰察布智算中心建设规模3 EFLOPS(浮点运算每秒300亿次)AI计算能力位于内蒙古枢纽节点算。
阿里云智能全球销售总裁蔡英华表示,智能计算不仅规模大,而且需要绿色、高效、工业实践。计算是一个庞大而复杂的系统,没有系统的核心技术能力,硬件堆积不能堆积计算能力,更不用说带来实际的工业价值了。
据了解,智能计算不同于通用计算,需要大量的数据AI在模式培训中,计算能力在数据迁移、同步等环节丢失,千卡以上的最低计算能力输出往往只有40%左右。这导致了高成本的智能计算能力,限制了行业的发展。通过系统的技术创新,阿里云改变了智能计算的损失问题,将千卡并行计算效率提高到90%以上。
例如,在通信技术方面,阿里云采用高性能自主研究Solar-RDMA网络实现端对端最低2微秒延迟,配合阿里云开发的无阻塞通信技术,使计算过程中的数据交换速度提高5倍。同时,自然风冷、液冷等绿色技术的应用降低了智能计算中心的能耗,PUE最低可达1.09。
在AI阿里云提供大数据 AI综合平台支持整个开发、运行和维护过程。特别是在模型培训环节,提供分布式培训框架,可以自动组合和优化分布式策略,使培训效率提高11倍以上。此外,阿里巴巴云还为用户提供了一站式的一般推理优化工具,定量、剪枝、稀疏、蒸馏算法模型,可提高推理效率6倍以上。
不久前,基于飞天智算,小鹏汽车在乌兰察布建设智算中心扶摇PFLOPS,它是中国最大的自动驾驶智能计算中心,将自动驾驶模型训练提速近170倍。毫末智行基于飞行智能计算,实现128卡并行效率超过96%,降低了62%的自动驾驶模型训练成本,提高了110%的训练速度,大大缩短了模型迭代周期。
在生命科学领域,深度科技采用飞天智算平台后,集群性能优化提高了100%以上,分子动力学仿真模拟训练效率提高了5倍。在工业领域,智己汽车采用高性能计算,将工业仿真效率提高25%,智能驾驶培训效率提高70%,加快新车型研发上市。山东德州电力通过AI审核预测,准确率达到98%,从1小时缩短到几分钟。
在城市治理领域,四川成宜高速公路通过数字双胞胎协同优化,将事故率降低60%。通过遥感数据和模拟演绎,重庆水务实现了95%的水利调度预测准确性;南方电网和中国气象局利用智算能力提高气象预报的准确性和稳定性。
此外,飞天智算还支持阿里巴巴的人工智能实践和阿里巴巴AI平均每天调用1万亿次,为全球10亿人提供服务。其中,李涛的训练速度提高了200倍,10亿张图片的训练时间从2.5个月缩短到8小时。达摩研究所模型M6仅使用512张GPU,10万亿参数模型训练在10天内完成,能耗仅为GPT-3在同一参数规模下的1%。
Lattice中国海量优质的信息资源、行业资讯、最新开发方案等资讯信息平台。