昨天,微软将DeepSeek-R1列入提供的模型目录
昨天,微软官网显示,DeepSeek R1现已在Azure AI Foundry和 GitHub上的模型目录中提供,加入了1800多个模型的多样化产品组合,包括前沿、开源、行业特定和基于任务的AI模型。
作为Azure AI Foundry的一部分,DeepSeek R1可在值得信赖、可扩展且企业级就绪的平台上访问,使企业能够无缝集成高级AI,同时满足SLA、安全性和负责任的AI承诺——所有这些都由Microsoft的可靠性和创新支持。
英伟达表示下一代NVIDIA Blackwell架构将通过第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的测试时间扩展,第五代Tensor Core可提供高达20 petaflops的峰值FP4计算性能,以及专门针对推理优化的72-GPU NVLink域。
私募股权巨头、全球主要人工智能系统数据中心投资者黑石集团仍持乐观态度。“我们仍然认为,实体基础设施、数据中心和电力的需求十分迫切,”黑石总裁乔纳森·格雷(Jonathan Gray)周四在与投资者举行的第四季度财报电话会议上表示。“这些需求的使用方式可能会发生变化。”
格雷表示,与投资界和企业界的大多数人一样,黑石集团的高管在过去一周花了大量时间来权衡DeepSeek的影响。近年来,黑石集团积极购买和建设数据中心,这是科技公司运行人工智能系统所使用的物理基础设施。2021年,黑石集团以100亿美元收购了美国数据中心公司QTS,去年,黑石集团牵头以约160亿美元收购了在亚洲运营数据中心的AirTrunk。
格雷同时预计,随着人工智能计算能力成本的大幅下降,人工智能将得到更广泛的应用。换句话说,虽然人工智能模型回答特定问题所需的能力可能会减少,但人们会提出更多问题。格雷表示,黑石集团只为签订长期租约的科技公司建造数据中心。“我们不会投机性地建造它们。”他指出,客户使用这些数据中心的方式很可能会改变。
另:
英伟达称,DeepSeek-R1等推理模型不会提供直接响应,而是对查询进行多次推理,采用思路链、共识和搜索方法来生成最佳答案。执行这一系列推理过程(使用推理得出最佳答案)称为测试时间扩展。DeepSeek-R1是此扩展定律的完美示例,证明了加速计算对于代理AI推理的需求至关重要。
由于模型可以反复“思考”问题,因此它们会创建更多输出标记和更长的生成周期,因此模型质量会不断提高。大量的测试时计算对于实现实时推理和来自DeepSeek-R1等推理模型的更高质量响应至关重要,这需要更大规模的推理部署。R1在需要逻辑推理、推理、数学、编码和语言理解的任务中提供了领先的准确性,同时还提供了高推理效率。
为了帮助开发人员安全地试验这些功能并构建自己的专用代理,6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服务可以在单个NVIDIA HGX H200系统上每秒提供多达3872个令牌。开发人员可以使用应用程序编程接口(API)进行测试和试验,该接口预计很快将作为可下载的NIM微服务提供,是NVIDIA AI Enterprise软件平台的一部分。
DeepSeek-R1 NIM微服务通过支持行业标准API简化了部署。企业可以通过在其首选的加速计算基础设施上运行NIM微服务来最大限度地提高安全性和数据隐私。通过使用NVIDIA AI Foundry和NVIDIA NeMo软件,企业还可以为专门的AI代理创建定制的DeepSeek-R1 NIM微服务。
DeepSeek-R1是一个大型混合专家(MoE)模型。它包含了令人印象深刻的6710亿个参数——比许多其他流行的开源LLM多10倍——支持128000个Token的大输入上下文长度。该模型还在每个层中使用了极多的专家。R1的每一层都有256位专家,每个Token并行路由到八个不同的专家进行评估。
为R1提供实时答案需要许多具有高计算性能的GPU,并通过高带宽和低延迟通信进行连接,以将提示令牌路由到所有专家进行推理。结合NVIDIA NIM微服务中提供的软件优化,一台使用NVLink和NVLink Switch连接的带有八个H200 GPU的服务器可以以每秒高达3872个令牌的速度运行完整的6710亿参数DeepSeek-R1模型。这种吞吐量是通过在每一层使用 NVIDIA Hopper 架构的FP8 Transformer Engine实现的,并且使用900GB/s的NVLink带宽进行MoE专家通信。
又另:
据新加坡《联合早报》网站1月31日援引美国媒体报道,美国国防部已采取行动禁止使用中国人工智能(AI)企业深度求索(DeepSeek)的AI模型,但在此之前,国防部员工曾将办公电脑连接到中国服务器,且已使用该模型至少两天时间。
DeepSeek 资料图(视觉中国)
彭博新闻社1月30日引述不具名的国防部官员和另一名知情人士的话报道称,国防部信息系统局28日晚间采取行动,禁止访问这家中国公司的网站。
这位知情人士称,在做出这个举动之前,美国防官员对其工作人员使用该工具表示担忧。
据彭博新闻社报道,美国国防部的一些办公电脑屏幕上显示该网站被屏蔽。