印度国家电子和信息技术部(MeitY)的印度AI团队上周五发布了一份AI愿景文件,呼吁在国家计算基础设施上进行大规模建设。这一计划将包括三个层面的计算能力,即高端计算、推理和边缘计算,以及拥有200/400Gbit/sec速度的分布式数据网格。
高端计算资源主要用于模型训练,计划包括40 exaflops的计算能力,其中部分来自于10,000个GPU,以及200PB的存储容量。愿景文件要求中级层或推理部门在印度的四个地理中心分布20.8 exaflops的计算能力(其中12用于训练,8.8用于推理),以及400PB的存储容量。每个中心需要1,000个GPU来进行推理任务,以及750个用于AI训练。
注:Exaflop 是衡量超级计算机性能的单位,表示该计算机每秒可以至少进行10^18或百亿亿次浮点运算。
愿景文件还提到了边缘计算资源,它为计算资源有限且数据较小的用户提供了便利。这允许用户在低端计算机上和自己的数据上测试假设。边缘中心提供了240PB的存储容量,分布在印度的12个不同地点。每个中心有125个用于AI训练的GPU,总计为6 exaflops,以及用于AI推理的500个GPU,总计为13.2 exaflops 。目前尚不清楚这些exaflop是否期望在每个站点上实现,还是分布在边缘计算中。
与中国早些时候宣布的150 exaflops 额外计算能力相比,印度计划的80 exaflops投资规模较小。
印度AI团队指出,截至2022年11月,中国拥有世界超级计算机的最大份额,达到162台,占Top500列表中记录的计算机的32%。而印度仅拥有三台,但印度国家超级计算任务(NSM)旨在将这一数字增加到24台。
愿景文件还呼吁组建国家数据训练资源,包括非个人数据,计划命名为印度数据集平台(IDP)。这些数据集具有数据驱动的治理潜力,也可用于初创企业和研究。
需要指出,这份AI愿景文件目前只是一个计划,尚无确定性是否会被采纳,尽管部长们急于让印度快速采用AI。愿景文件也未提及采购,这是一个重大问题,因为为任何实体采购GPU并不容易。