为什么华为要推出自主研发的分布式数据库?

内容来源:公众号“DeepTech深科技”

时隔半年之后,华为的 “D 计划” 终于有了大进展终端反攻云端再从云端落地,这一过程,筑成华为在 ICT(信息及通信技术)领域的核心价值力量。

5 月 15 日上午,华为正式发布全球首款人工智能原生(AI-Native)数据库 GaussDB 和分布式存储 FusionStorage 8.0 并且基于 “数据 + 智能 理念下,与多家合作伙伴一起重新定义数据基础设施。这是继去年 10 月 10 日华为对外发布了 AI 战略,和 12 月 21 日发布华为智能计算战略之后,又一重要产品发布。

500

作为业界首款支持 ARM 架构的企业级数据库,GaussDB 采用 MPP(Massive Parallel Processing)架构,支持行存储与列存储,提供 PB(Petabyte)级别数据量的处理能力。与竞品相比,GaussDB 首次将 AI 技术引入分布式数据库帮助企业客户使用人工智能技术来管理他们的数据。另外,GaussDB 也是一个通用的数据库,支持本地部署、私有云、公有云等多种场景。

在运行数据库中,稳定的存储能力是必不可少的。而 FusionStorage 8.0 正是针对保障 OLAP 或 OLTP 类关键业务数据库高效稳定运行的分布式存储产品,通过重定义存储架构,从 “Storage for AI” 和“AI in Storage”两个维度,融入 AI 技术,多方面实现智能运维。

500

过去十年,随着企业应用的快速发展,数据增多,许多企业都不再专注于本地搭建数据库,而是启用云计算业务来管理数据和资金。并且,数据库软件是任何公司基础架构中最关键的部分之一,它会使企业能够拥有易于访问的大量数据。所以,华为新发布的这套分布式数据产品,对于个人、组织、公司等多种用户来说,是至关重要的。

GaussDB 数据库是何方神圣?

500

伴随着互联网行业的快速发展,智能时代已经到来。在这个时代下,如何处理大量数据,成为该领域中的最大挑战。

华为数据库 GaussDB,希望通过智能、异构、融合这三个方面,重新定义数据处理平台。

500

利用 AI 技术,从数据库设计、开发、验证、调优、运维等各个方面,华为正重新建立新的数据处理技术。然后,将人工智能技术融入至分布式数据库的生命周期中,实现自运维、自管理、自调优、故障自诊断和自愈。

我们都知道,传统数据库与搭载 AI 技术的数据库在算力、存储、硬件方面是完全不一样的。传统数据库所需要的算力与架构都较为简单,但若要导入 AI 算法模型处理数据、优化资料库效能,就需要更强大的硬件算力资源配合。所以,华为在早前推出了其首款 AI 芯片昇腾 910,其算力可以达到 256TFOPS,是目前全球已发布的单芯片计算密度最大的 AI 芯片。

在算力面前,存储功能与应用也在企业的导入全面云化的工作任务场景中扮演主要角色。分布式存储 FusionStorage 8.0,将针对分布式数据库提供性能引擎,单节点性能高达 16.8 万每秒读写速度(IOPS)和 1 毫秒以内的延时速度,可以让数据库变得更快。

500

由于 GaussDB 搭载了华为自主研发的 AI-Native 自调优技术,通过深度学习,能够根据用户使用场景、使用负载,自动去响应针对性的数据处理能力,合理、快速建立 AI 数据库模型。

500

(来源:华为提供)

就此,算力、存储、AI 芯片之间的融合,重新定义数据库架构,将 AI 技术融入内核中,让数据库更智能。

在异构层面,GaussDB 通过异构计算创新框架,充分发挥 X86、ARM、GPU、NPU 等多种算力优势,性能比业界提升 48% 左右;支持丰富的业务负载,其中包括金融交易、融合分析、结构化数据等。

在发布会上,华为首席数据库科学家李国良指出,GaussDB 利用 AI + 异构计算框架,支持图片、视频等,相比传统处理数据产品来说,图像高维向量提升八倍以上。值得注意的是,这个计算是把 AI 算法直接移植到数据库中,通过端到端的方式连锁起来,才会有八倍的提升。

500

与此同时,对于支持 GaussDB 的场景,华为 ICT 战略 Marketing 总裁汪涛表示,GaussDB 是一个通用的数据库,服务对象包括个人、组织、公司等多种用户,所以本地部署、私有云、公有云等场景,都是可以胜任的。而在华为云上,GaussDB 将为金融、互联网、物流、教育、汽车等行业客户提供全功能的云上数据仓服务。

就此看来,GaussDB 其实是将原有的云数据库产品重新设计、调整架构,自研出一套 AI-Native 技术,而在算力、存储、AI 共同加持下,将深度学习技术首次引入分布式数据库中,帮助企业客户使用人工智能技术来管理他们的数据。


为什么华为现在要发布它?

500

在采访环节,当被记者问到现在进入数据库领域是否有些晚的时候,汪涛表示,GaussDB 的研发开始于 2011 年,历经九年的研发投入,今天才对外揭开面纱

一向谨慎的华为,正在一步步构建万物互联的智能世界。

相较于其他同样具有国际级巨头分量的中国科技企业,例如阿里巴巴、百度、腾讯等,华为直到过去一年才开始公开宣示全面拥抱 AI,并进一步宣示全面 AI 发展战略。但在发布 AI 战略之后,华为接连推出从云端底层到 AI 芯片层面的新品。

500

2018 年 10 月 10 日,DeepTech 曾报道《华为后发制人,一口气连发两款 AI 芯片,“双全”AI 解决方案曝光!传说中的神秘 AI 计划揭开面纱》,华为首次向外界发布了其公司的 AI 战略,也就是华为高层之间称的 “D 计划”,以及全场景的 AI 解决方案。

在会上,华为正式推出其第一颗 AI 芯片——昇腾 910,并且首次在战略层面和 AI 硬件技术方面,华为提供支持,从终端的人工智能技术反攻至云端。

去年 12 月 21 日,DeepTech 报道《生态为王,华为首次对外宣布智能计算新布局!昇腾系统与自有 Arm 服务器芯片成最大亮点》,华为正式发布其智能计算战略。在会上,华为推出了智能数据中心以及服务器基础设备、新一代智能网络芯片以及统一架构解决方案,提供从云端统一架构,再到算力上的技术支持。

500

新发布的数据库 GaussDB 和分布式存储 FusionStorage 8.0 两款产品,更像是华为将云端战略落地,提供在算力供应、数据协同、场景部署、专业技术四方面的解决方案,从端到端之间,定义新的数据基础设施,形成产业生态。

正如本文开头所说,随着企业应用的快速发展,数据增多,数据库软件变得愈加重要,是任何公司基础架构中最关键的部分之一,所以,华为新发布的这套分布式数据产品,筑成华为在 ICT 领域的核心价值力量。

华为的数据库产品是否真的有竞争力?

500

2019 年 5 月,第三方数据调研平台 DB-Engines 对全球数据库进行了排名。数据显示,全球数据库前六名毫无不变,分别是:Oracle(甲骨文)、MySQL、Microsoft SQL Server、PostgreSQL、MongoDB 和 IBM Db2。

500

对于数据库领域长期被甲骨文、微软、亚马逊、IBM 等美国厂商所占据,国内阿里云、腾讯云纷纷推出新品,比如 POLARDB、TencentDB 等,华为 GaussDB 作为最后入局的数据库产品,竞争力到底在哪里?

更多人认为,首先是开放,可以产生优势。华为 IT 产品线副总裁黄瑾在接受采访时表示,华为一直积极推动基于 Open SDS(开放软件定义存储)的标准顺畅互通从标准层面保持一个开放合作的产业生态。而在平台和工具层面,华为将会为客户提供更加易用的工具,吸引客户在华为云平台上做开发。

500

相比其他在新零售、互联网层面的云端竞争,华为并不涉及。华为拥有终端设备产品可以为合作伙伴提供更多的支持,这也是华为云在 ICT 领域的竞争力之一。

其次就是隐私保护和数据安全。数据库是计算,是存储,也涉及网络和内存,它们都是非常密集的基础设施,所以安全方面变得十分重要。

举个例子,早前外媒曾报道,美国网络安全公司 UpGuard 发现,上亿条保存在亚马逊 AWS 服务器上的 Facebook 用户信息记录,可以被任何人轻易地公开获取。而后,Facebook 方面承认该数据存在,并表示已经删除相关的数据库。

所以,对于云端基础设施层面,隐私保护与数据安全,是非常重要的。汪涛在接受相关提问时回应:“网络安全不是某一个公司的问题,是整个全社会,各个政府、各个组织,甚至个人的共同课题,我们需要通过一个系统性的方法,通过更先进的技术来共同解决,才能真正保证网络安全和信息安全。”

500

与此同时,汪涛还表示,虽然华为总部在中国但是在全球 170 多个国家范围内华为是最重视网络安全的公司。过去 30 年以来,华为在网络安全技术方面做了大量投资,在网络安全和数据保护方面,华为公司领先于这个行业。

由此可见,华为 GaussDB 在开放、安全、性能、应用和存储层面,已经做好了万全的准备,只等待最终的开花结果。

-End-

最近更新的专栏

全部专栏