哎呦CPU,您可别累着,兄弟CIPU在云上帮把手
图文原创:谭婧
云厂商对新型计算架构的渴望,是歇斯底里的。
几条街之外,都能听见唠叨声:“哎呦,CPU,快放下,您哪敢动这,可不能把资源浪费在网络和存储的负载上。”
云计算的基础技术工作之一,就是通过“软件定义”的方法,把传统的、以CPU为中心的计算体系架构,变成可售卖的公共计算资源。
如今,做好云计算,光懂软件不够了,要懂更多东西:计算机体系结构。
由此拉开云厂商突围基础设施战场的序幕,阿里云打赢这一仗,更有资格服务全球400多万客户,用好全球百万台服务器。
百万台服务器,这么多,怎么管?
“飞天”来管。
飞天是阿里云自研的云计算操作系统,也是分布式操作系统。
通过虚拟化,池化,调度的技术,把所有的物理资源通过算力的方式,就像一台服务器这样进行工作。
把这么多的物理资源以云计算的方式送到客户手里。
计算机先驱艾伦·凯(Alan Kay)曾说过:“真正在乎软件的人,应该自己造硬件”。
为了让云计算的软件更厉害,我们拉上专用硬件来帮忙。
原来是硬件 “统一”帮忙,现在是硬件“特意”帮忙,所以是专有硬件。
所以,智能网卡和DPU被热烈讨论。
每一家云厂商的软件不一样,更准确地说,各家云计算厂商的系统软件栈大有不同,要专门为需求设计硬件,定制化硬件加速。
一切损失,皆是浪费。
多系统的性能跟传统硬件提供的性能相比,会有一些硬件性能的损失。看看阿里云今天的规模,浪费0.1%,都是一大笔钱。
为了得到更好的产品,光靠通用硬件不行。
而软硬件的深度协同的技术演进路径下,云厂商有独家秘诀(Know-How)。
往大里说,云计算时代呼唤新型计算机体系架构。
这次创新,是从计算机在IDC的内部体系结构里面做创新,从以往的以CPU为中心的体系架构,迈入以“云操作系统+CIPU”为中心的体系架构。
飞天云操作系统运行在CIPU之上,管理和调度底层物理资源。飞天内核包含神龙计算、盘古存储、洛神网络和安全,都对CIPU本身所具备的能力做了深度适配。
CIPU是一颗云端处理器,它相当于把飞天操作系统跟服务器衔接。
软件上,CIPU支持飞天云操作系统,高效完成虚拟化资源编排调度。
硬件上,飞天操作系统通过CIPU能快速云化管理数据中心物理设备,并对网络和存储硬件进行加速。
这样一来不仅不会再浪费CPU的算力,还能增强网络和存储的性能。
CIPU是云计算时代的新型计算机体系架构。
想了解今天,必须读懂昨天。
第一步,搞懂任务卸载。
CPU承担两个角色:
第一个是计算。
第二是控制,有很多控制逻辑,它去协调整个服务器上的各种组件,包括网络、硬盘。
这对一个单一服务器来说,这个逻辑非常正确。
而云计算管理的服务器规模非常大,就是它要控制的是数以百万的节点的存储的资源、网络的资源,它要来进行控制,这个时候单一CPU的控制能力是做不到的。
如此体量下,飞天云操作系统需要把控制和计算的逻辑进行重新定义。
CPU单打独斗,既要处理大量的上层应用,又要维持底层软件的基础设施,还要处理各种特殊任务(IO类协议),不堪重负。
所以,把“负担”从CPU上卸载下来,包括将网络进程,虚拟化功能卸载到专用硬件上,数据中心的服务器里,会逐步加入各种加速卡,云计算领域会涌现出一批代表性产品。
算力资源就好比“房屋实用面积”,有没有浪费,全凭技术实力。
第二步,搞懂计算架构。
“飞天+CIPU”想要达到的目标,是把上百万台服务器变成一台超级计算机。
大量的计算需要跨网络存储、跨网络进行数据交互,在这个过程里面,CIPU来加速。CIPU是一个大数据中心、大云计算的控制器的概念,是算力加速。
阿里云认为,应打破以CPU为中心的传统云计算体系架构,定义新一代云计算基础技术。
阿里云这款CIPU处理器,和CPU不是替代关系,CIPU是一种不同的计算架构形态。
“灵感”来自于阿里云神龙卡,神龙卡是阿里云自研的产品,外界不能生产神龙卡,阿里云也不对外销售。
可以说,神龙卡是CIPU的一种实现。或者说,CIPU是神龙卡的产业化标准。
云计算的基础设施是多流派技术的集大成者。
有软件,有硬件,有计算,有网络,有存储,有虚拟化,有安全,有加速器,有驱动,有框架,有应用,精粹交织。
云计算业务的成熟度高,逼着基础设施的成熟度攀高,这也是阿里云定义新型计算机体系架构的动因。
(完)
更多阅读
AI框架系列:
DPU系列:
2. 永远不要投资DPU?
其他:
3. 隐私计算:消失的人工智能 “法外之地”
4. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?
5. AI芯片公司:拿下“超级石油”,助力地质模拟和人工智能
6. 两大榜单揭晓啦,2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500
7. “重型卡车自动驾驶,无量产,则无意义”赢彻科技CTO杨睿刚博士观点
漫画系列
1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单
4. AI for Science这事,到底“科学不科学”?
最后,再介绍一下主编自己吧,
我是谭婧,科技和科普题材作者。
为了在时代中发现故事,
我围追科技大神,堵截科技公司。
偶尔写小说,画漫画。
生命短暂,不走捷径。
还想看我的文章,就关注“亲爱的数据”。
"分享、在看、点赞、打赏 "都是爱