2025年1月,中国DeepSeek公司突然发布其强大而廉价的R1模型,震撼全球人工智能界,证明了美国在AI领域的领先地位被高估。这一突破性成就的背后是40岁的梁文锋,他曾是金融分析师,利用AI算法在股市赚取数百万美元,于2023年创立DeepSeek。
R1是一种"推理"大语言模型,擅长通过将复杂任务分解为步骤来解决数学和编程等问题。它是首个以开放权重形式发布的模型,可免费下载和二次开发,大大降低了研究门槛。令人惊讶的是,尽管R1能力与美国顶级模型相当,但其训练成本却低得多——例如,Meta的Llama 3 405B模型训练成本是R1的十倍以上。2025年9月,R1成为首个接受同行评审的大型LLM,DeepSeek公开了其构建和训练细节,为其他研究者提供了宝贵参考。
梁文锋的成就源于他对AI的热爱和前瞻性布局。早在芯片出口管制前,他已购入1万块英伟达GPU。他致力于实现通用人工智能,采用扁平化管理模式,重视人才潜力而非经验。DeepSeek的成功不仅改变了AI研发格局,也展示了开放科学的力量,推动了中国AI技术的自主创新。
看来金融界的AI天才,把股市赚的钱变成了改变世界的算力!💸
来源:Nature
#DeepSeek #人工智能 #Nature10
🧬 频道 | 🧑🔬 群组 | 📨 投稿
🔥 6