梁文锋称DeepSeek V4于4月下旬发布,将以Apache 2.0协议开源
PChome 4月10日消息,据《创智记》从多位知情人士处获悉,DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek新一代旗舰大模型DeepSeek V4将于本月下旬正式发布。

近期网页端上线 “快速模式”与“专家模式”,支持简洁搜索与长程复杂任务处理,被视为V4能力的预演。“专家模式”实测在代码生成、数学推理等复杂任务中表现突出,但高峰时仍需排队。
据悉,新模型将实现重大技术突破,包括万亿参数规模、百万级上下文窗口,并在推理阶段首次全面适配华为昇腾等国产AI芯片,成为国内首个在全链路算力上彻底摆脱英伟达依赖的万亿级大模型,推理速度较V3提升35倍,能耗降低40%。

3月29日 DeepSeek经历了13 小时服务中断,恢复后开发者实测模型逻辑严谨性、代码生成能力均显著提升,疑似为V4灰度测试。同时,新版本通过“存算分离”机制搭建创新构架,将静态知识存储与动态推理解绑,实现降低算力消耗并提升长文本连贯性。

DeepSeek V4预计将以Apache 2.0协议开源,支持企业自主部署,并已被阿里、腾讯、字节等科技巨头提前预订算力资源,计划集成至其云服务与AI产品中。



PChome官方账号





