OpenAI发布“o1”新一代大模型,计划以1500亿美元估值进行新一轮融资

500

最新消息显示,传言中有高级推理能力、此前被称为"草莓项目"的OpenAI新项目于北京时间9月13日凌晨推出。OpenAI在官网介绍,一个新的推理(reasoning)模型系列将开始提供,这个系列模型将用于解决困难问题,这些模型将在做出反应前花更多时间思考,可以通过复杂的过程进行推理,解决比以往更难的科学、编码和数据问题。OpenAI此次在ChatGPT和API接口渠道上先推出该系列的预览版本OpenAI o1-preview。此前据彭博社报道,OpenAI正在洽谈以1500亿美元的估值,融资65亿美元。其中1500亿美元的估值,是融资前估值。估值1500亿美元,意味着OpenAI的估值较今年年初有大幅增加。在年初部分投资者将股份出售给风投公司套现时,对OpenAI的估值是860亿美元,新一轮融资前的估值达到1500亿美元,较年初时就增长了74%。此外,除了洽谈的65亿美元融资,OpenAI还在磋商以循环贷款的形式从银行获得50亿美元的资金。在两笔共计115亿美元的资金到位之后,就将为他们的研发及运营提供充足的资金保障。

综合 | 彭博社 WSJ WIND通讯社 OpenAI

编辑 | Echo

本文仅为信息交流之用,不构成任何交易建议

500

目前还不清楚微软、苹果和英伟达这三大科技巨头,在OpenAI新一轮的融资中会投入多少资金。但在上月底的报道中,曾有媒体提到,作为牵头方之一的兴盛资本,是计划投入约10亿美元,英伟达则是计划投入1亿美元。

但无论微软、苹果和英伟达投入多少资金,他们参与OpenAI新一轮的融资,都将增强与OpenAI的合作。

OpenAI CEO Sam Altman(山姆·奥特曼)在社交平台上表示,OpenAI o1是一个新范式的开始,即AI能够进行通用复杂推理。

OpenAI o1包括三个型号,除o1-preview 之外还将有o1和o1-mini。其中o1-mini是一种更快、更便宜的推理模型且适用于需要推理但不需广泛世界知识的应用,o1-mini还比o1-preview便宜80%。

技术方面,OpenAI介绍,新系列模型经过训练,学会完善自身思维过程并尝试不同策略,能认识到自己的错误。新系列模型更新后的性能类似于博士生在物理、化学、生物学中完成具挑战性的基准任务。新系列模型还在数据和编码方面表现出色,在国际数学奥林匹克竞赛(IMO)的资格考试中得分83%,对比之下GPT-4o仅正确解决了13%的问题。新系列模型还在竞争性编程问题Codeforces比赛中排名前89%。

在技术研究相关文章中,OpenAI介绍,公司用大规模强化学习算法“教会”模型在数据高效训练时用思维链进行高效思考。随着强化学习增加和思考时间增加,o1的性能不断提高。类似于人类在回答困难问题之前思考很长时间,o1也尝试在解决问题时使用思维链,该模型通过强化学习学会磨练思维链并改进策略,学会在当前方法不起作用时尝试不同方法,这提高了模型推理能力。

“作为早期模型,它还难以使ChatGPT变得更加有用,例如通过浏览网页获取信息或上传文件和图像。对于很多常见案例,GPT-4o短期内能力还是更好。”OpenAI表示。

不过该系列新模型增强的推理功能可能对解决科学、编码、数学和类似领域的复杂问题更有效,例如,医疗保健研究人员可用它来注释细胞测序数据,物理学家用它生成量子光学所需的复杂数学公式,开发人员可用它构建和执行多步骤工作流程。量子物理学者Mario Krenn就展示了GPT-4o不能回答但o1-preview正确完成计算的复杂量子物理问题。

OpenAI研究人员Noam Brown在社交平台上提到OpenAI o1系列的更多细节,他表示,o1系列经过强化学习训练,在通过自己的思维链做出反应前会思考,思考时间越长,推理任务表现越好。“这为大模型缩放(scaling)开辟了新维度,我们不再受预训练的瓶颈限制,现在也可以扩展推理计算了。”Noam Brown表示,但o1模型并不总是比GPT-4o好,有时人们不值得长时间等待o1响应,在个人写作和编辑文本时人们可能会偏好GPT-4o,在计算机编程、数据分析和数学计算领域则可能会偏好OpenAI o1。

Noam Brown透露,OpenAI o1在回答前会思考几秒,但OpenAI的目标是让未来的版本思考几个小时、几天甚至几周,虽然推理成本会更高,但人们有可能也会获得更多,例如在研发新抗癌药等方面,人工智能可以不仅仅是聊天机器人。

在安全方面,OpenAI则透露,新模型的思维链推理为确保对齐和安全提供了新的机会,隐藏的思维链为监控模型提供了独特的机会,使人能“读取模型思想”并理解其思维过程。此外,公司最近与美国和英国的人工智能安全研究所达成协议,开始将相关协议付诸实施,包括允许各机构尽早使用该模型的研究版本,这有助于建立一个在公开发布之前和之后对未来模型进行研究、评估和测试的流程。

据报道,OpenAI 2024年年度经常性收入达到34亿美元,相比2022年的全年收入2800万美元有了大幅提升。其收入主要来源于ChatGPT的订阅版本(包括ChatGPT Plus、ChatGPT Enterprise和ChatGPT Team订阅)以及面向开发者的API接口服务等。然而,由于构建和运行模型的成本高昂,OpenAI的支出一直超过收入增长,预计2024年的成本将达到85亿美元左右,仍然处于亏损状态。

此前,OpenAI已进行了多轮融资,截至2024年5月,OpenAI已在11轮融资中筹集了135亿美元。其中,2023年1月微软投资约100亿美元。自2019年以来,微软已向OpenAI投入了130亿美元,目前持有OpenAI 49%的股权。

OpenAI的融资主要用于满足算力需求,人工智能的训练和运行需要强大的计算能力支持,大量的资金用于采购和租赁高性能的计算设备、服务器集群,以及构建先进的数据中心等基础设施,以提升模型的训练效率和处理能力,比如租用微软的服务器集群来支持ChatGPT及其底层大模型的运转。

此外,OpenAI已接触博通等公司探讨研发全新的AI芯片,甚至计划筹集资金改造全球半导体产业,推动通用人工智能发展。开发专门的AI芯片有助于提高模型的训练和运行效率,降低成本,提升AI系统的整体性能。基于这个目标,OpenAI也需要大笔资金。

OpenAI目前已经发布GPT-4系列。GPT-4发布后得到了广泛应用,OpenAI也在不断对其进行优化和改进。2023年11月6日,OpenAI在首届全球开发者大会上推出了支持高达1.28万tokens的新模型GPT-4 Turbo,其上下文对话长度更长,价格也有所降低,还推出了多模态API等。

但是,更为进阶的GPT-5却迟迟没有消息。根据美国达特茅斯工程学院公布的对OpenAI首席技术官米拉・穆拉蒂的采访视频,GPT-5将在一年半后发布,也就是大概在2025年底或2026年初。

OpenAI首席执行官山姆・奥特曼表示,GPT-5的性能提升程度将超乎想象,会在高级推理功能上实现质的飞跃,类似GPT-3到GPT-4的跨越。

有推测GPT-5可能在多模态理解方面有重大进步,比如整合语音、图像甚至视频等,实现跨模态的内容生成和理解,增强交互能力。在长文本处理和长逻辑推理任务上也有望取得突破性进展。

全部专栏