• 首页
  • 报告
  • 资讯
  • 快讯
  • 图表
  • Ai问答
  • 网址导航
报告派首页快讯724时讯查看内容

0 评论

0 收藏

2025-2-6 20:31

【李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型 ...】

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

最新评论