首页 > 其他分享 >11.25

11.25

时间:2025-01-01 22:41:50浏览次数:1  
标签:DeepSeek 11.25 幻方 GPU 量化 模型

事实上,DeepSeek 的成功并非偶然。这家由中国知名量化私募巨头幻方量化于 2023 年创立的公司,在成立仅半年后就推出了第一代大模型 DeepSeek Coder,这一模型不仅免费商用,还完全开源。

不过,在当时的百模大战中,DeepSeek 发布的新模型或许并未引起太多关注。然而,令人意想不到的是,在后来各大科技巨头掀起大模型价格战之前,DeepSeek 已率先打破常规,大胆掀翻了大模型价格的“桌子”,吸引了众多目光。

深挖之后,众人才发现,这家较为低调 AI 初创公司其实早深耕 AI 领域多年且极具前瞻性,早在 2019 年,幻方量化就投资了 2 亿元自主研发深度学习训练平台“萤火一号”,搭载了 1100 块 GPU,到了 2021 年幻方量化对“萤火二号”投入增加到 10 亿元,且搭载了约 1 万张英伟达 A100 显卡,而在当时,国内拥有超过 1 万枚 GPU 的企业屈指可数,不超过 5 家。

标签:DeepSeek,11.25,幻方,GPU,量化,模型
From: https://www.cnblogs.com/liyize/p/18646438

相关文章

  • 11.25
    考试要求一、本试卷为2022级《JAVA语言程序设计》上机考试试卷;二.注意编程规范:(1) 通过Eclipse添加类的方式建立类;(2) 程序开头部分注释班级、作者、学号、日期;(3) 注意程序代码中必要的空格与缩进;(4) 注意类、变量、方法的命名原则;三.考试结束后,将整个项目工程文件夹中的文件源......
  • 11.25
    软件设计                 石家庄铁道大学信息学院 实验 22:状态模式本次实验属于模仿型实验,通过本次实验学生将掌握以下内容: 1、理解状态模式的动机,掌握该模式的结构;2、能够利用状态模式解决实际问题。 [实验任务一]:银行账户用Java代码模拟实现课堂......
  • 11.25~12.15 总结
    题目有点多,这里就不写算法相关内容了(其实也没搞完)。NOIP前主要为了增加一点调试能力去写了大模拟,但是好像用处不是很大。NOIP场上主要的问题是半场开始比较懈怠,以及没有严格测试程序(虽然这次运气比较好没有挂T3和T2的大部分分数)。必须在Linux下测试程序和所有大样例。场......
  • 11.25 每日总结(适配器模式)
    今天学习适配器模式马上要设计模式考试了,ε=(´ο`*)))唉 定义:适配器模式将某个类的接口转换成客户端期望的另一个接口表示,目的是消除由于接口不匹配所造成的类的兼容性问题。主要分为三类:类的适配器模式、对象的适配器模式、接口的适配器模式。 定义: 适配器模式将某个类......
  • 11.25
    语句并非按顺序执行 C++ 程序表现得仿佛它们是按顺序执行的,完全遵守了 C++ 流程控制语句的控制。上句话影响优化的计算机行为 | 19中的含糊其辞的“仿佛”正是许多编译器进行优化的基础,也是现代计算机硬件的许多技巧的基础。当然,在底层,编译器能够而且有时也确实会对语句......
  • C#/.NET/.NET Core技术前沿周刊 | 第 15 期(2024年11.25-11.30)
    前言C#/.NET/.NETCore技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NETCore领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。欢迎投稿、推荐或自荐优质文章、项目、学习资源等......
  • C#/.NET/.NET Core技术前沿周刊 | 第 15 期(2024年11.25-11.30)
    前言C#/.NET/.NETCore技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NETCore领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。欢迎投稿、推荐或自荐优质文章、项目、学习资源等。......
  • 11.25实验 23:策略模式
    [实验任务一]:旅行方式的选择旅游的出行方式有乘坐飞机旅行、乘火车旅行和自行车游,不同的旅游方式有不同的实现过程,客户可以根据自己的需要选择一种合适的旅行方式。实验要求:1. 画出对应的类图;  2. 提交源代码;packagestrategy; publicclassPerson{    priv......
  • 上周热点回顾(11.25-12.1)
    热点随笔:· 2024年各编程语言运行100万个并发任务需要多少内存? (InCerry)· .NET9-Swagger平替Scalar详解(四) (IT规划师)· 《HelloGitHub》第104期 (削微寒)· MySQL用错了,99%的人已中招 (苏三说技术)· .NETCore线程池(ThreadPool)底层原理浅谈 (叫我安不理)·......
  • 11.25日报
    完成设计模式实验十八,以下为今日实验内容:实验18:迭代器模式本次实验属于模仿型实验,通过本次实验学生将掌握以下内容:1、理解迭代器模式的动机,掌握该模式的结构;2、能够利用迭代器模式解决实际问题。     [实验任务一]:JAVA和C++常见数据结构迭代器的使用信130......