全球第二大开源公司面世!Cloudera和Hortonworks完成合并。

源 / 顶级程序员   文 / 江户川雨

完成合并

上周五,大数据领域Hadoop母公司Cloudera官方发文宣布完成与Hortonwork合并工作,两家公司合并后采用Cloudera作为新公司名称。

500

去年 10 月份,大数据领域 Hadoop 巨头 Cloudera 与 Hortonworks 宣布合并,给业界带来不小震动。

这两个公司希望通过合并,创造出一个年收入达到 7.2 亿美元的新实体,并制定清晰的行业标准,成为下一代数据平台领先者,提供业界第一个企业级数据云,提高公共云的易用性和灵活性。当时预计该交易将在2019年第一季度完成。

一直以来 Hortonworks 团队投资于实时数据流和数据摄取以支持边缘的物联网使用案例,而 Cloudera 更专注于 AI 和 ML 领域,使数据科学家能够使用极其复杂的工具来自动化机器学习工作流。

去年10月,谈到两家公司的合并,Cloudera的首席执行官Tom

Reilly就表示,“我们两家公司的业务具有很强的互补性和战略性。通过将Hortonworks在端到端数据管理方面的投资与Cloudera在数据仓库和机器学习方面的投资结合起来,我们将提供业界首个从Edge到AI的企业数据云。这一愿景将使我们的公司能够在追求数字化转型的过程中推动我们对客户成功的共同承诺。”

对于这一次的正式合并,Hortonworks 联合创始人、现 Cloudera 首席产品官 Arun Murthy 在文中表示:

“现在,我们可以将我们的资产和互补的策略结合起来,提供第一个企业数据云,释放数据的力量,任何数据从边缘到 AI,运行在任何云上,在100% 的开源数据平台上。”

“标志着业界第一个企业数据云的开端,它在企业所需要工作的任何地方为数据提供适合的数据分析。”

同时,Cloudera还发布了自己的战略规划:

Cloudera Data Platform

Cloudera Data Platform(CDP)是Cloudera新兴的“企业数据云”战略的核心。

CDP就是之前说的统一(Unity)版本。

Cloudera新的CDP平台会同时支持运行在本地,私有云,以及5个最大的公有云包括Amazon,Microsoft,Google,IBM和Oracle。但Cloudera并没有披露交付CDP的时间表。

Cloudera透露,这一次正式合并之后,将进行两次CDP的迭代。

“一旦我们完成并交付第一版CDP,则会开始第二个后续版本,然后你可以考虑升级和迁移到CDP,这将是一个全新的平台,”Cloudera的首席产品官Arun Murthy,前Hortonworks的联合创始人说。

第一个CDP版本将包含CDH6.x和HDP3.x中的一系列组件,并将专注于运行客户现有的工作负载和数据。

“很明显,CDP的关键并不仅仅只是提供支持你现有的工作负载,同时还提供围绕关键工作负载的全新的直观感受,例如data warehousing, data flow, the edge or streaming, AI and machine learning。”

500

CDH和HDP平台

Cloudera在声明中还宣布,将会支持CDH5.x/6.x和HDP3.x直到2022年1月。这也与之前的说法一致。

Cloudera对HDP 2.x的支持将在3年之后结束。Cloudera相信3年时间足够让现有的客户规划如何从旧的CDH和HDP迁移到统一平台CDP并进行实施。

Hortonworks Data Flow(HDF)将集成到CDH,从而可以在CDP平台推出之前,让CDH的客户能够受益于Hortonworks的实时数据抽取和流计算技术。

同样的,Cloudera Data Science Workbench(CDSW)也会整合到HDP,CDSW是Cloudera的机器学习和AI开发工具。这可以让HDP的客户开始使用CDSW。

有意思的是,Hortonworks之前比较推荐的ML和AL开发工具是IBM Data Science Experience产品,尽管很少有人真正期望Cloudera支持它,但似乎没有关于CDH客户使用这类工具的消息。

500

Cloudera CPO Arun Murthy绘制了CDP迁移路径

云计算

除了提供SQL分析和机器学习,CDP平台同时还需要为客户保证数据安全和数据治理。对于复杂的CDP来说这其实并不简单。

Cloudera CPO Arun Murthy说:“要实现这一目的,关键是帮助你运行所有这些工作负载并能够管理这些数据,无论是在本地,私有云还是公有云,其中很大一部分是包含安全和治理的,这样你不用担心将你的数据或工作负载从一个公有云迁移到另一个公有云,或者从物理本地迁移到公有云。”

Cloudera的首席执行官Tom Reilly表示:“几乎每个企业都在走向公有云,他们喜欢云提供的简单和弹性。但他们也知道如果只是基于公有云服务也会是一个非常昂贵的选择,无论是在短期内因意外导致的运营成本提升,还是长期来看可能被锁定。”

Reilly表示,云计算在Cloudera的前瞻战略中占据重要位置,实际上也是投资和增长的第一大领域。但Cloudera的战略也不是完全基于云,因为这不是企业所需要的。

“很明显,客户都系统同时拥有云选择和云体验,”Reilly继续补充道,“我们也同意。在Cloudera,我们始终在拥抱云。我们相信,从边缘到AI的机器学习和分析,在所有云(公有和私有)中始终如一地无缝运行,正是企业所需要的。这就是我们所说的企业数据云(enterprise data cloud)。”

500

Cloudera机器学习GM Hilary Mason说,CDP开发期间,HDP用户也可以使用CDSW

Cloudera机器学习GM Hilary Mason表示,Cloudera希望帮助客户构建跨越多学科和交付模式的智能应用程序,这在大规模场景下并非易事。

Hilary Mason表示:“在Cloudera我们看到一些成功的组织在其业务中嵌入机器学习和人工智能,以改善客户体验,自动化运营,降低风险并创造真正的价值,这不是建立一个应用或者模型。优秀的机器学习需要团队,组织和基础架构来构建和管理数百甚至数千个应用程序和模型。”

Hilary Mason还说:“这需要能够快速进行实验并采取行动,降低整个组织的预测成本,在Cloudera,我们将这种趋势称为AI的工业化。这是我们的战略重点,实现了一个目标即快速和简单的识别机器学习申请,然后构建,部署和维护,并且很好理解以及在整个业务中保持一致。”

第二大开源公司

Hortonworks于2014年上市,Cloudera去年首次公开募股。 8月,Hortonworks报告最近一个季度的收入增长40%,达到8630万美元,而Cloudera在9月初报告的第二财季收入增长23%,达到1.103亿美元。2018年10月4日,两家公司宣布合并。

当时,市场研究公司Wikibon的分析师斯图•米尼曼(Stu Miniman)表示,这笔交易在坊间已传了一段时日,代表了两个宿敌之间的联姻。他说:“势不两立的Hatfields家族和McCoys家族携手起来。”

正式合并当天,Hortonworks联合创始人,现Cloudera首席产品官Arun Murthy发文表示:“去年年底,经过几次接触后,我们认为合并联合起来是有意义的。自两家公司成立以来,我们共享了近十年的共同开源传统,以及我们在社区建立和支持的基础技术平台。正是因为如此,我们的团队已经非常相似,并已经通过社区相互了解。我们合并的速度证明了我们的共同愿景和观点。”

500

Cloudera联合创始人、首席策略官 Mike Olson也在当天发文表示:“多年来,Cloudera和Hortonworks一直是激烈的竞争对手,您可能猜想我们两家在未来几个月和合并后的整合中如何携手并行。作为对自己的硬核死忠派,我大方的承认过往历史。但要眺向远方,我保证我已经往前看了。

我们更大的办公室里来自两边的同事也会这样。原因很简单:赌注太高了,回报也会很大,不要被过去所累。作为一家公司,我们和以前各自独立的时候一样投入。”

500

 Arun Murthy在自己的博文中兴奋的说:“昨天我们是 Hortonworks,今天,随着我们合并的正式完成,我们是 Cloudera——现在是全球第二大开源软件公司。”

目前全球第一大开源软件公司仍旧是红帽。

素材链接:https://www.datanami.com/2019/01/10/cloudera-unveils-cdp-talks-up-enterprise-data-cloud/

500

-END-

全部专栏