DeepSeek新项目名“MODEL1”曝光,与现有模型“V32”并列出现

2026年1月22日消息,DeepSeek在开源社区GitHub更新了自研推理加速框架FlashMLA的代码,横跨114个文件中有28处提及“MODEL1”标识符,与现有模型“V32”并列出现,代码差异显示其独立于V3系列架构,属于全新分支。

500

据了解,技术社区分析,“MODEL1”并非迭代补丁,而是全新架构,可能与传闻中计划于2月中旬农历新年期间发布的DeepSeek V4直接相关,代码显示,“MODEL1”在键值缓存布局、稀疏性处理、FP8数据格式解码支持等方面与V3.2显著不同。

500

同时,新增SM100架构专用内核,需CUDA 12.9+环境启用,FP8量化支持显存占用降低30%以上,稀疏算子算力利用率达350 TFlops。

站务

全部专栏