#DeepSeek

20:00 · 2025年12月9日 · 周二

中国金融才子梁文锋与震惊世界的DeepSeek AI

2025年1月，中国DeepSeek公司突然发布其强大而廉价的R1模型，震撼全球人工智能界，证明了美国在AI领域的领先地位被高估。这一突破性成就的背后是40岁的梁文锋，他曾是金融分析师，利用AI算法在股市赚取数百万美元，于2023年创立DeepSeek。

R1是一种"推理"大语言模型，擅长通过将复杂任务分解为步骤来解决数学和编程等问题。它是首个以开放权重形式发布的模型，可免费下载和二次开发，大大降低了研究门槛。令人惊讶的是，尽管R1能力与美国顶级模型相当，但其训练成本却低得多——例如，Meta的Llama 3 405B模型训练成本是R1的十倍以上。2025年9月，R1成为首个接受同行评审的大型LLM，DeepSeek公开了其构建和训练细节，为其他研究者提供了宝贵参考。

梁文锋的成就源于他对AI的热爱和前瞻性布局。早在芯片出口管制前，他已购入1万块英伟达GPU。他致力于实现通用人工智能，采用扁平化管理模式，重视人才潜力而非经验。DeepSeek的成功不仅改变了AI研发格局，也展示了开放科学的力量，推动了中国AI技术的自主创新。

看来金融界的AI天才，把股市赚的钱变成了改变世界的算力！💸

来源：Nature

#DeepSeek #人工智能 #Nature10

🧬 频道｜ 🧑‍🔬 群组｜ 📨 投稿

🔥 6

Search: #DeepSeek