阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

  • deepseek r1提供的蒸馏模型大部分是基于阿里的坤,只有8b和70b是基于meta的Lllama,也就是用deepseek的输出结果对坤、羊驼这些模型做了微调。

    用了一下14b的r1,这个是基于坤的,问“阿里云的 Qwen2.5 系列模型是开源的吗”
    -------------
    关于“Aliyun Qwen 2.5 系列模型”是否开源的问题,目前没有明确的信息表明这是一个具体的开源AI模型。
    如果你指的是由阿里巴巴达摩院开发的相关模型(如“通义”系列),通常这类模型的开源状态需要参考官方声明。一般来说:
    开源的可能性较低:商业化的云服务提供商(如阿里云)倾向于将核心模型作为 proprietary(专有)产品,以确保其技术优势和市场竞争力。API 服务为主:即使模型本身不完全开源,用户可以通过阿里云的 API 接口使用这些模型进行推理或训练,具体定价和服务条款可参考阿里云平台。
    如果你对某个具体的“Qwen”系列模型有疑问,请提供更多信息,或者直接访问阿里云官方网站查询相关产品文档。
    -------------

    而网页版的r1
    ------------------
    截至2024年7月,阿里云的 Qwen2.5 系列模型(如 Qwen2.5-72B、Qwen2.5-7B 等)未完全开源,其代码和模型权重并未向公众开放下载。不过,阿里云采取了以下开放策略:
    ……
    建议
    若需开源模型,推荐使用 Qwen1.5 系列(GitHub仓库)。
    若需使用 Qwen2.5,需通过阿里云官方渠道(如灵积平台)申请 API 权限或合作授权。
    ----------------------

    本地部署的还是远不如网页版的性能强大,但坤的小模型至少还是免费提供给普通用户用的。

    没有4090测不了32b的。

回复1

返回文章

站务

全部专栏