事实上,DeepSeek 的成功并非偶然。这家由中国知名量化私募巨头幻方量化于 2023 年创立的公司,在成立仅半年后就推出了第一代大模型 DeepSeek Coder,这一模型不仅免费商用,还完全开源。
不过,在当时的百模大战中,DeepSeek 发布的新模型或许并未引起太多关注。然而,令人意想不到的是,在后来各大科技巨头掀起大模型价格战之前,DeepSeek 已率先打破常规,大胆掀翻了大模型价格的“桌子”,吸引了众多目光。
深挖之后,众人才发现,这家较为低调 AI 初创公司其实早深耕 AI 领域多年且极具前瞻性,早在 2019 年,幻方量化就投资了 2 亿元自主研发深度学习训练平台“萤火一号”,搭载了 1100 块 GPU,到了 2021 年幻方量化对“萤火二号”投入增加到 10 亿元,且搭载了约 1 万张英伟达 A100 显卡,而在当时,国内拥有超过 1 万枚 GPU 的企业屈指可数,不超过 5 家。
标签:DeepSeek,11.25,幻方,GPU,量化,模型 From: https://www.cnblogs.com/liyize/p/18646438