• 首页
  • 报告
  • 资讯
  • 快讯
  • 图表
  • Ai问答
  • 网址导航

2025DeepSeek技术全景解析-重塑全球AI生态的中国力量

2025-3-11 18:25| 发布者: 派大星12 0

摘要: DeepSeek背靠资金实力雄厚的幻方量化2025年1月,DeepSeek发布其最新开源模型DeepSeekR1,再度引发全球人工智能领域关注。DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,一家创新型 ...
DeepSeek背靠资金实力雄厚的幻方量化2025年1月,DeepSeek发布其最新开源模型DeepSeekR1,再度引发全球人工智能领域关注。

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

DeepSeek背靠资金实力雄厚的幻方量化,DeepSeek创始人为梁文锋,梁文锋同时也是幻方量化的创始人,幻方量化是国内头部量化私募管理人,旗下有两家百亿量化私募,分别是2015年6月成立的浙江九章资产和2016年2月成立的宁波幻方量化。

Deepseek大模型不断优化选代回顾其发展历史, 2024年1月,发布第一版大模型--DeenSeek1LM,这个版本使用传统的Transformer架构,但在训练方面已经明显体现出DeepSeek团队通过不断优化训练策略,达到节约成本,提高效率的思想,这点也在后续的模型迭代中被发扬光大。

2024年5月,DeepSeek-V2发布,从这一代开始,DeepSeek模型开始使用混合专家(MOE)架构,这是传统Transformel架构的一种改进和扩展,该架构使DeepSeek模型能以更低的计算成本进行更复杂的推理,极大提升了模型的性能。

2024年12月,DeepSeek-V3上线并开源,V3版本对MOE架构进行了进一步优化,在维持低训练成本的同时,稳定性与多方面性能表现都达到了与领先闭源模型相当的水平。

2025年1月,DeepSeek-R1正式发布,R1模型的推理能力得到极大加强,与OpenA1-01模型不相上下,且推理过程完全透明,因此在全球范围备受关注。