哎呦CPU,您可别累着,兄弟CIPU在云上帮把手

500

图文原创:谭婧

云厂商对新型计算架构的渴望,是歇斯底里的。

几条街之外,都能听见唠叨声:“哎呦,CPU,快放下,您哪敢动这,可不能把资源浪费在网络和存储的负载上。”

500

云计算的基础技术工作之一,就是通过“软件定义”的方法,把传统的、以CPU为中心的计算体系架构,变成可售卖的公共计算资源。

如今,做好云计算,光懂软件不够了,要懂更多东西:计算机体系结构。

由此拉开云厂商突围基础设施战场的序幕,阿里云打赢这一仗,更有资格服务全球400多万客户,用好全球百万台服务器。

500

百万台服务器,这么多,怎么管?

“飞天”来管。

飞天是阿里云自研的云计算操作系统,也是分布式操作系统。

通过虚拟化,池化,调度的技术,把所有的物理资源通过算力的方式,就像一台服务器这样进行工作。

把这么多的物理资源以云计算的方式送到客户手里。

500

计算机先驱艾伦·凯(Alan Kay)曾说过:“真正在乎软件的人,应该自己造硬件”。

500

为了让云计算的软件更厉害,我们拉上专用硬件来帮忙。

原来是硬件 “统一”帮忙,现在是硬件“特意”帮忙,所以是专有硬件。

所以,智能网卡和DPU被热烈讨论。

500

每一家云厂商的软件不一样,更准确地说,各家云计算厂商的系统软件栈大有不同,要专门为需求设计硬件,定制化硬件加速。

500

一切损失,皆是浪费。

多系统的性能跟传统硬件提供的性能相比,会有一些硬件性能的损失。看看阿里云今天的规模,浪费0.1%,都是一大笔钱。

为了得到更好的产品,光靠通用硬件不行。

而软硬件的深度协同的技术演进路径下,云厂商有独家秘诀(Know-How)。

500

往大里说,云计算时代呼唤新型计算机体系架构。

500

这次创新,是从计算机在IDC的内部体系结构里面做创新,从以往的以CPU为中心的体系架构,迈入以“云操作系统+CIPU”为中心的体系架构。

飞天云操作系统运行在CIPU之上,管理和调度底层物理资源。飞天内核包含神龙计算、盘古存储、洛神网络和安全,都对CIPU本身所具备的能力做了深度适配。

CIPU是一颗云端处理器,它相当于把飞天操作系统跟服务器衔接。

软件上,CIPU支持飞天云操作系统,高效完成虚拟化资源编排调度。

500

硬件上,飞天操作系统通过CIPU能快速云化管理数据中心物理设备,并对网络和存储硬件进行加速。

这样一来不仅不会再浪费CPU的算力,还能增强网络和存储的性能。

CIPU是云计算时代的新型计算机体系架构。

想了解今天,必须读懂昨天。

第一步,搞懂任务卸载。

CPU承担两个角色:

第一个是计算。

第二是控制,有很多控制逻辑,它去协调整个服务器上的各种组件,包括网络、硬盘。

这对一个单一服务器来说,这个逻辑非常正确。

而云计算管理的服务器规模非常大,就是它要控制的是数以百万的节点的存储的资源、网络的资源,它要来进行控制,这个时候单一CPU的控制能力是做不到的。

如此体量下,飞天云操作系统需要把控制和计算的逻辑进行重新定义。

CPU单打独斗,既要处理大量的上层应用,又要维持底层软件的基础设施,还要处理各种特殊任务(IO类协议),不堪重负。

500

所以,把“负担”从CPU上卸载下来,包括将网络进程,虚拟化功能卸载到专用硬件上,数据中心的服务器里,会逐步加入各种加速卡,云计算领域会涌现出一批代表性产品。

算力资源就好比“房屋实用面积”,有没有浪费,全凭技术实力。

500

第二步,搞懂计算架构。

“飞天+CIPU”想要达到的目标,是把上百万台服务器变成一台超级计算机。

大量的计算需要跨网络存储、跨网络进行数据交互,在这个过程里面,CIPU来加速。CIPU是一个大数据中心、大云计算的控制器的概念,是算力加速。

阿里云认为,应打破以CPU为中心的传统云计算体系架构,定义新一代云计算基础技术。

阿里云这款CIPU处理器,和CPU不是替代关系,CIPU是一种不同的计算架构形态。

“灵感”来自于阿里云神龙卡,神龙卡是阿里云自研的产品,外界不能生产神龙卡,阿里云也不对外销售。

可以说,神龙卡是CIPU的一种实现。或者说,CIPU是神龙卡的产业化标准。

云计算的基础设施是多流派技术的集大成者。

有软件,有硬件,有计算,有网络,有存储,有虚拟化,有安全,有加速器,有驱动,有框架,有应用,精粹交织。

500

云计算业务的成熟度高,逼着基础设施的成熟度攀高,这也是阿里云定义新型计算机体系架构的动因。

(完)

 

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨贾扬清独家专访(二)

DPU系列:

1.造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

其他:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

3. 隐私计算:消失的人工智能 “法外之地”

4. 售前,航空母舰,交付,皮划艇:银行的AI模型上线有多难?

5 AI芯片公司:拿下“超级石油”,助力地质模拟和人工智能

6两大榜单揭晓啦,2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500

7. “重型卡车自动驾驶,无量产,则无意义”赢彻科技CTO杨睿刚博士观点

漫画系列

1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,人工智能算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

​还想看我的文章,就关注“亲爱的数据”。

500

500

"分享、在看、点赞、打赏 "都是爱

全部专栏