这个高考季,人工智能又冲上了全民关注话题榜。
据教育部此前发布的《列入普通高等学校本科专业目录的新专业名单(2021年)》显示,人工智能和大数据等专业热度不减,依然是本年度新增专业大户。其中,“人工智能”成为最大热门新增专业,共有清华大学、中山大学等130所高校增设此专业。
专业的增减变化,不仅折射出了该专业未来的发展态势与就业前景,更反映出了我国经济社会需求和产业发展的趋势。近年来人工智能专业的频频增设,与我国将人工智能上升为国家战略的路线不谋而合。
同时,人工智能也备受市场期待。据中国信通院数据研究中心测算,2020年中国人工智能产业规模为3031亿元,同比增长15.1%,占全球市场规模近三成。而在这背后,再次引发了人们对人工智能的各种“经典”讨论:人工智能的未来是什么样的?人工智能究竟能不能带来新一轮生产力革命?
算力,21世纪的基础设施
2001年,电影《AI》上映,影片中,人们可以制造出具有情感的机器人。
电影《AI》剧照
20年后的今天,虽然这一目标还未实现,但我们早已离不开了人工智能。比如内容推荐、智能质检、远程医疗、智慧交通……
智能质检
可见,21世纪,人工智能正在成为新的生产工具,算力已成为新生产力,数据成为新生产资料。
18世纪的蒸汽机、19世纪的电力、20世纪的计算机,三次工业革命,带来三次生产力提升。但纵观下来,这三次革命都有一个共同的特点——蒸汽、电力、带宽,都演变成了当时的基础设施。
瓦特改良的蒸汽机模型
而算力作为21世纪的新生产力,能否成为基础设施?基础设施,“普惠性”和“大众化”是其主要特征,也就是说一要便宜,二要让更多人用得上,比如电、燃气。
人工智能算力符合么?
为什么建设人工智能计算中心?
当前我国的人工智能算力最大的一个问题之一就是太分散,因为一些企业选择了自建人工智能计算中心。而另一些尚未建设人工智能计算平台的企业,面对人工智能浪潮下的数字化转型,却不知道如何下手。于是,国家主导投资建设的人工智能计算中心应运而生。
一中心四平台
以“一中心四平台”支持产业发展:一中心是指计算中心,四平台是指公共算力服务平台、应用创新孵化平台、产业聚合发展平台、科研创新和人才培养平台。
往小了说是端到端打通“政”“产”“学”“研”“用”全产业链,算力以集群赋能产业集群,帮助企业进行数字化转型、提质增效。
人工智能计算中心作用
往大了说就是把人工智能算力打造成如同水、电、气一样的基础设施,通过普惠的算力促进我国经济与产业发展融合、支撑国家战略任务落地。
简言之,就是像发电站那样,为万千企业输送算力。用现在的惯用行语就是“赋能”。
那么,人工智能计算中心打造的集中算力能成为基础设施么?分散算力为什么不行?究其原因,无非与制约人工智能产业进程的三个维度分不开:大模型训练、模型训练时间、效率与成本。
集中算力支持训练大模型
AI模型的训练对于产业发展的意义毋庸置疑。而AI模型尤其是大模型的训练就需要大算力的支撑,如今AI模型训练所需要的算力平均每100天就会翻番,2012年至2019年算力需求翻了30万倍。
GPT-3模型参数1750亿
今年以来,大模型层出不穷,而且一个比一个大,GPT-3模型参数1750亿,鹏程·盘古大模型参数2000亿。
鹏程·盘古2000亿级中文预训练大模型/图源机器之心
然而,期间AI算力的增长远远落后于需求的增长速度,人工智能计算中心则能满足这一增长需求。
此前鹏城实验室基于昇腾AI基础软硬件平台的人工智能大科学装置——鹏城云脑,就是很好的实践落地。其推出的全球首个千亿参数预训练中文模型:鹏程—盘古大模型,可以实现支持“一带一路”常见的79种语言。因此,集中算力支持训练大模型,分散算力不支持。
集中算力节约模型训练时间
上世纪初,汽车还是奢侈品的标志,即便是美国,普通民众想买一辆汽车,也十分困难。但一款汽车的问世,彻底改变了这种情况。
1908—1927年间这款车卖出了1500万辆,一度占了美国当时汽车市场份额的56%以上。
该款汽车名为福特T型轿车,当时售价仅为260美元/辆,而当时美国工人的平均工资是每年200-400美元之间,高收入群体的律师和牙医,平均收入是2000-2500美元。
福特T型轿车
按照购买力算,这款车的价格妥妥的是现在我们的五菱宏光水平。表面上看,是价格拉低了汽车售价,让汽车从奢侈品变成了大众品。深一层,则是流水线的功劳,当时美国生产一辆汽车的时间需要700多个小时,而福特T型采取流水线作业之后,仅需12.5个小时,售价从几千美最终降到了260美元。到了今天,汽车流水线甚至1分钟就能生产出一辆汽车。
汽车流水线
类比一下,集中算力训练模型就如同流水线团队协作,而分散算力由于“单兵”特征,效率自然不高。经过测算,人工智能计算中心的集中算力拥有1024个节点,可使同样的模型由原先拥有8个节点的分散算力的203分钟提速至1.48分钟,极大缩短训练时间,增加训练效率。因此,从模型训练时间上来看,集中算力模型训练时间短。
集中算力效率更高
自从共享概念流行起来之后,共享汽车、共享办公室等共享经济模式层出不穷。集中算力可以简单理解为共享经济的一种——共享算力。事实上,集中算力正发挥着“共享模式”的高利用率优点。据测算,企业分散的小算力利用率仅为10%-15%,浪费严重,而人工智能计算中心的算力利用率在80%以上。为何差距这么大?
因为企业分散算力难以共享,当业务量不饱和的时候,就会闲置。有人说,可以少部署一些算力不就行了?还真不行,不仅要有足够的算力,还要有备用的,用于应对业务变动。
人工智能计算中心机房/图源长江日报
而人工智能算力中心的公共算力池,可以让多个企业使用公用,用多少取多少,这个企业用完,另一个企业可以继续用,闲置率低,利用率也就高了。比如,武汉人工智能计算中心,在2021年5月31日投运后一直都是满负荷运行,基本实现了闲置率“归零”。
成本方面,国家主导的人工智能计算平台充分利用集约土建、电力、运维优势,降低了总体建设和运维成本。因此,从效率和成本上看,集中算力资源利用率高,规模效应后的费用更低。
人工智能,我们输不起
总而言之,无论是进行数字化转型的传统企业,还是新兴人工智能企业,面对不断增加的算力成本,自身算法团队很难支撑起越来越复杂的现实业务需求。因此需要一个低门槛、开放、端到端的人工智能算力中心,采用集中算力,降本增效。目前,除了武汉之外,成都、南京等地的人工智能计算中心已开工建设,不久之后,就会与我们见面。
南京人工智能计算中心发布仪式
这只是开始,而后,除了这些地方,更多人工智能计算中心将会在全国各地出现。这些,足以说明我国对人工智能算力的重视程度。不仅我国,纵观全球,至少有50多个国家把人工智能当做国家战略。
图源:中国信息通信研究院和人工智能与经济社会研究中心
不过,算力作为新的生产力,也面临许多挑战,需要落实集中算力的普惠功能,真正发挥出“电力”和“石油”的作用,为产业提供源源不断动力。用得上,用得起,用得好的算力资源,才是真正的变革生产力的基础设施。
时代已经把我们推到了创新科技的赛道上,此时,把握住人工智能产业发展机遇成为制胜关键。让我们借人工智能计算中心这柄利剑,激发出集中算力的强大优势,使能人工智能产业,赋能千行百业智能化升级,抢占未来竞争制高点。