在数据中心规模小的情况下,这点损耗似乎不算什么。但当数据中心的服务器数量在十万级、百万级,即使1%的损耗也是巨大的。通过自研神龙云服务器,阿里最终解决了服务器虚拟化后的损耗问题。如今,阿里在数据中心领域的自研已经遍及芯片、交换机、光模块、RDMA(远程直接数据存取)设备,以及电源、液冷服务器集群等部件,“几乎涉及了除CPU之外大多数的设备部件。”
同样走这条道路的还有腾讯,如上文所提到的,在腾讯自建的新数据中心里,已使用了自研的存储设备(分布式存储 TFS)、交换机、光传输、服务器(星星海)等设备。为什么在传统数据中心已经发展十余年、技术趋于成熟的条件下,科技巨头要放弃采购的方式而选择更费力的自研?
这背后的一个原因是:传统设备是针对传统数据中心而研发的,并不适合云数据中心;而自研的设备可以让数据中心更好地面向云计算。自研的另一个好处是,可以对数据中心有更强的掌控力,“比如一旦数据中心发生故障,我可以快速知道出的问题在哪儿,以及如何维修。。
最后,自研也是出于降成本的考虑。“过去的设备依赖采购,我们不太能控制这方面成本。而自研之后,我可以根据云计算的需求自己设计,把不需要的模块拿掉,或者将不需要的指令集、功能删掉。”他称。
当数据中心的规模足够大,对设备的需求足够多,自研设备的成本就能较采购的模式下降很多。自研和自建如同一条双螺旋,为未来的超级数据中心筑起技术护城河。这背后折射的,是科技巨头全面押注云计算的决心。