苏州市干将路303号创意产业园
0512-3565 6563
Jackjones@kuaidata.com
联系客服
数据中心托管服务/管理式网络
服务:
400 651 8888
微软云服务:
400 089 2448
markjune@kuaidata.com
内容分布式网络服务:
400 811 0278
云集成与合作:
cloud@kuaidata.com
2024-06-26
日前,国家互联网信息办公室发布第六批深度合成服务算法备案信息,腾讯、喜马拉雅、支付宝、快手等厂商的492个应用产品在列。
新一轮AI浪潮席卷而来,生成式人工智能技术正飞速向千行百业融入,“千模大战”的产品涉及多模态、多行业。面对前所未有的激烈竞争,大模型发展既需要跨过算力门槛,更还需要齐全的“朋友圈”。
AI的迫切性与算力新需求
得益于AI高效的生产力与简单的交互方式,以大模型为代表的新一波AI浪潮,在带来生产力爆发的同时,还将引发新一轮的产业市场洗牌。
这恰恰说明,AI不是大模型厂商的专属,与其他领域、传统行业都有关,与每个企业也息息相关,业界甚至有“企业不参与AI就会被淘汰”的说法。
看得见的大模型、AI狂飙背后,是看不见的算力在支撑。以大模型为代表的新一波AI浪潮,正在对算力提出新需求。
需求一:从通用算力到智能算力
随着人工智能产业进入爆发增长期,企业数量快速增加,大模型不断涌现,模型参数达千亿级甚至万亿级,智能算力需求呈指数级增长。截至去年6月,我国算力总规模达到197EFLOPS,其中智能算力规模占整体算力规模的比例提高到25.4%,超过四分之一,智能算力规模同比增长45%,比算力规模整体增速高15个百分点。
可以看出,以通用算力为主的算力格局迎来改变,智能算力成为增长主力。
这一点在“东数西算”枢纽与数据中心集群体现的更为明显。在和林格尔数据中心集群,服务器装机能力已超过370万台,算力总规模达到4.7万P,其中智能算力4.1万P,位居全国前列;预计到今年底,和林格尔数据中心集群内服务器装机能力超过400万台,算力总规模将达到6.5万P,其中智能算力5.8万P,智算占比将达到89%,有力支撑人工智能产业发展。
需求二:高性能
大模型迭代速度越来越快,参数越来越大,对智能算力提出了更高性能的挑战。
面对万亿级参数的大模型,单体服务器乃至单体智算中心都算力有限,需要将大量服务器通过高性能网络相连,打造大规模智算集群,目前GPU并行是大模型训练的必备技术,对于大模型并行计算来说,不仅需要更高性能的芯片与服务器,以加快计算速度,对网络也有更高要求——需要将庞大的参数有机地分布到多张GPU卡中,并保持不同GPU卡之间有效的通信,整体配合完成大模型的训练部署。
更高的计算精度、更高吞吐和更低延迟,意味着更高的计算效率,更快的训练与推理,抢先赢得市场和用户青睐。
需求三:高可靠性
作为大模型的基石,算力的稳定性与可靠性至关重要。大模型等AI训练周期往往长达数月,海量服务器组成的AI计算集群易发生故障,算力不稳情况下会造成训练中断,降低训练成功率,也使训练成本居高不下。而据统计,在数据中心宕机事故中,电力因素占比近一半,可以说,电力稳定性在一定程度上决定算力的稳定性。
提到智算中心的电力供应保障,和林格尔表现优秀。目前,和林格尔新区已建成变电站8座,其中500千伏变电站2座,220千伏变电站2座,110千伏变电站4座,形成了五路八回的电力保障优势,供电负荷完全可以保证现有数据中心需求。
需求四:绿色低碳
大模型训练需要大量能源,智算中心比传统的数据中心要消耗更多电力,也付出更多运营成本。OpenAI曾发布报告指出,自2012年以来,AI训练应用的电力需求每3到4个月就会翻一倍。ChatGPT每天要响应大约2亿个请求,在此过程中消耗超过50万度电力,也就是说,ChatGPT每天用电量相当于1.7万个美国家庭的用电量,
成本压力之外,还有我国“双碳”战略的不断推进,都促使绿色低碳成为智算发展的必然趋势,其中使用绿色能源成为最重要也是必需的手段。
据悉,和林格尔所在的呼和浩特市正增强绿色能源替代,已经与华电集团合作,建设华电和林格尔数据中心集群绿色能源供给示范项目,积极探索绿电直供模式,实施绿色能源供给示范项目,通过“风-光-储”一体化清洁能源供电方式为算力基础设施提供“绿电”,未来,该地数据中心可实现100%绿电供应。
定于6月29日在呼和浩特举办的2024中国绿色算力(人工智能)大会,将汇聚国家部委和单位领导、自治区领导、院士、知名专家学者,国内算力相关企业、机构、高校负责人等,展开绿色算力与人工智能发展的前沿交流与合作,聚焦产业热点与趋势进行深度分享与对话。
算力之外大模型发展还需要朋友圈
过去的一年,科技大厂、人工智能企业和创业公司等众多玩家切入大模型赛道,上半场的竞争是资源和投入的比拼,随着产业发展的日趋成熟,技术落地和商业闭环的形成将成为产业发展面临的新挑战。
目前AI大模型产业链可以分为三部分:上游为基础层,包括芯片、服务器、算力、数据、网络、模型开发训练平台等;中游为大模型,我国生成式人工智能技术发展时间较短,目前产品和企业主要集中在中游,大模型数量不断增加,这也带来了产业规模快速扩大;下游为应用层,大模型可以生成包括文本、图片、音频、视频等在内的多种模态的内容,应用于传媒、电商、影视、金融、游戏、制造、教育等领域,千行百业通过使用模型技术,可以提高效率、降低成本、改善用户体验等,推动各个行业的发展和变革。
现阶段,智算中心建设时拉动地区实现人工智能发展的重要驱动力,各地十分重视算力尤其是智能算力的投入。以和林格尔数据中心集群所在的呼和浩特市为例,他们在现有数据装机规模的基础上,继续引进建设一批国家部委、大型国有企业、头部企业数据中心项目,包括加快建设中国建设银行、交通银行、浦发银行、人保集团等数据中心项目,积极争取华夏银行、光大银行等数据中心项目落地,不断做大数据存储和算力规模,到“十四五”末装机能力达到350万台。
对于希望发展AI产业的地区来说,需要重视算力的建设,又不能仅仅只建设算力,从上游服务器制造、数据清洗标记,到下游行业应用场景开发对接,构建完善的产业生态,聚合产业链上、中、下游的玩家,实现互补协同,打通供需链接,方能吸引越来越多AI企业落地发展。
和林格尔数据中心集群,正是产业上下游生态集聚的典型代表:上游集聚了服务器、传感器、高低压电控设备、机柜等设备制造以及半导体材料生产企业10多家;中游建成了国家互联网骨干直联点城市和国际互联网数据专用通道,以及前文提到的众多智算项目落地;下游则招引了20多家数据加工处理企业、10多家运营运维企业以及10个通用大模型,训练总参数量超过万亿,绿色算力全产业链集聚发展的生态体系加快形成。