• 2024-10-05comp10002 Foundations of Algorithms
    comp10002 Foundations of AlgorithmsSemester 2,2024Assignment 2LearningOutcomesInthisproject,youwilldemonstrateyour understanding ofdynamic memory and linked data structures (Chap- ter 10) and extend your program design, testi
  • 2024-09-24AI大模型推理性能优化之KV Cache
    前言本篇介绍KVCache。KVCache(键-值缓存)是一种在大模型推理中广泛应用的优化技术,其核心思想是利用缓存key和value来避免重复计算,从而提高推理效率。代价是显存占用会增加。核心思想在自注意力层的计算中,对于给定的输入序列,模型会计算每个token的key和value向量。这些向量的值
  • 2024-09-19kouyi06-919
     整理原文,解释每句英文和生词 这段文本讨论了多元文化主义的概念及其在社会中的实践,特别是对美国社会的评论。以下是对这段内容的整理和详细解释:###英文原文整理:1.Ithinkthatthedebateovermulticulturalismisessentiallythedebateoverwhosevalueswi
  • 2024-09-19How to Train your Bee
    HowtoTrainyourBeeAssignment2HelpGuide©Dreamworks,”BeeMovie”CALCULATEANOPTIMALPOLICYFORRecap:BellmanEquationBellmanEquationisusedtocalculatetheoptimalvalueofastateEquationlookscomplicated,butit’sjustthehighestexpected
  • 2024-09-16Datawhale------Tiny-universe学习笔记——Qwen
    1.Qwen整体介绍    对于一个完全没接触过大模型的小白来说,猛一听这个名字首先会一懵:Qwen是啥。这里首先解答一下这个问题。下面是官网给出介绍:Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。其实随着大模型领域的发展,这类产品已经有很多了例如:由
  • 2024-09-04【HuggingFace Transformers】OpenAIGPTModel源码解析
    OpenAIGPTModel源码解析1.GPT介绍2.OpenAIGPTModel类源码解析说到ChatGPT,大家可能都使用过吧。2022年,ChatGPT的推出引发了广泛的关注和讨论。这款对话生成模型不仅具备了强大的语言理解和生成能力,还能进行非常自然的对话,给用户带来了全新的互动体验。然而,ChatGPT
  • 2024-08-30深度强化学习算法(六)(附带MATLAB程序)
    深度强化学习(DeepReinforcementLearning,DRL)结合了深度学习和强化学习的优点,能够处理具有高维状态和动作空间的复杂任务。它的核心思想是利用深度神经网络来逼近强化学习中的策略函数和价值函数,从而提高学习能力和决策效率。一、关键算法分类1.1深度Q网络(DeepQ-Networ
  • 2024-08-30一次失败的实验 - 无限注意力,我们为什么坚持实验
    总结:随着我们增加内存压缩次数的次数,Infini-attention的性能会变得越来越差。据我们所知,ringattention、YaRN和ropescaling这三种方法仍是将预训练模型拓展更长上下文的最佳方式。引言:语言模型的上下文长度也是除模型性能之外的重要属性之一。自in-contextlearning(
  • 2024-08-26[USACO16DEC] Cities and States S
    [USACO16DEC]CitiesandStatesS题目描述FarmerJohn有若干头奶牛。为了训练奶牛们的智力,FarmerJohn在谷仓的墙上放了一张美国地图。地图上表明了每个城市及其所在州的代码(前两位大写字母)。由于奶牛在谷仓里花了很多时间看这张地图,他们开始注意到一些奇怪的关系。例如,FLIN
  • 2024-08-13Day 42 动态规划 Part09
    188.买卖股票的最佳时机IV做完上一道题后再看就简单许多了。股票问题的重点就在于两点:找到所有的状态状态如何转移对于本题,一共包含2*k种状态(第1,2...k次持有,第1,2...k次卖出)。状态间如何转移呢?见下图classSolution{publicintmaxProfit(intk,int[]prices){
  • 2024-08-12Day 41 动态规划 Part09 开始炒股
    动态规划解题步骤确定dp数组(dptable)以及下标的含义确定递推公式dp数组如何初始化确定遍历顺序举例推导dp数组121.买卖股票的最佳时机这道题虽然自己做出来了,但是做了后面的题再回头看它就有了不一样的理解。curMin更重要的代表了一种状态,代表遍历到当前时间时最低的股
  • 2024-08-05问一问神奇的ChatGPT
    Q:我们随机问\(k\)个数,取这些数的最大值\(m\),\(m\)应该不会距离\(\frac{k(k+1)}{n}\)太远的结论为什么成立?A:这个结论来自于统计学中的极值理论。具体来说,当我们从一个已知范围内随机选择一些数,并取这些数中的最大值时,这个最大值有一定的统计规律。假设我们从一个包含(\(
  • 2024-07-28Spring 状态机极简使用
    Spring状态机极简使用本文不探讨状态机的思想与Spring状态机的架构,仅做快速实现参考。Spring状态机官方文档项目参考代码基于SpringBoot配置的快速集成案例maven依赖配置<dependency><groupId>org.springframework.statemachine</groupId><artifactId>spring-s
  • 2024-07-28stable diffusion中的UNet2DConditionModel代码解读
    UNet2DConditionModel总体结构图片来自于https://zhuanlan.zhihu.com/p/635204519stablediffusion运行unet部分的代码。noise_pred=self.unet(sample=latent_model_input,#(2,4,64,64)生成的latenttimestep=t,#时刻tencoder_hidden_states=pro
  • 2024-07-20强化学习算法PPO实现
    PPO的基本思想策略优化:PPO直接优化策略,通过限制更新幅度来保证训练稳定性。Clip方法:PPO引入了clip方法限制策略更新的幅度,避免策略过大更新导致的不稳定。优势估计:使用优势函数来评估当前策略相对于某个基准策略的提升。详细的训练过程初始化:初始化策略网络(Actor)和价值网
  • 2024-07-19算法刷题笔记 八数码(C++实现)
    文章目录题目描述基本思路实现代码题目描述在一个3×3的网格中,1∼8这8个数字和一个x恰好不重不漏地分布在这3×3的网格中。例如:123x46758在游戏过程中,可以把x与其上、下、左、右四个方向之一的数字交换(如果存在)。我们的目的是通过交换,使得网格变为如下
  • 2024-07-12Franka Ros2 主要节点及关系
     控制节点:1.franka_hw_node功能:与硬件接口通信,处理低级控制。订阅话题:/franka/control_commands发布话题:/franka/hardware_states /franka/state_feedback2.franka_control_node功能:处理机器人控制命令,管理控制模式。订阅话题:/franka/state_feedback发布话题:/frank
  • 2024-06-15LLM大模型: MOE原理和源码解析
    1、古人云:闻道有先后,术业有专攻!每个人的能力范围是有限的,不可能360行,行行都精通!所以搞研究都会选一个细分领域深耕,争取在这个领域做到世界top级别的泰斗!一个团队,内部也都是在各个领域擅长的人组成,比如前端、ui、后端、算法、运维、运营等,大家互相配合,完成既定目标!本人多年前做
  • 2024-06-12LLM大模型: llama源码要点解读(二)
    1、attention机制:这算是transformer架构最大的创新点了!利用attention机制,找到token之间的相似度(或则说距离),根据相似度调整token本身的embedding值,本质就是根据token的context调整自身的embedding值,这个思路非常符合人脑对语言和语义的理解!比如”苹果“这个词,如果只看这一个t
  • 2024-06-09python后端结合uniapp与uview组件tabs,实现自定义导航按钮与小标签颜色控制
    实现效果(红框内):后端api如下:@task_api.route('/user/task/states_list',methods=['POST','GET'])@visitor_token_requireddeftask_states(user):name_list=['待接单','设计中','交付中','已完成','
  • 2024-06-06mcc mnc list
    mccmnclist来源  https://www.mcc-mnc.com/ MCCMNCISOCountryCountryCodeNetwork28968geAbkhazia7A-Mobile28988geAbkhazia7A-Mobile28967geAbkhazia7Aquafon289299geAbkhazia7FailedCalls289999geAbkhazia7FixLine412
  • 2024-06-03Pytorch根据论文手搓CoPE
    根据论文《ContextualPositionEncoding: LearningtoCountWhat’sImportant》编写的CoPE代码。具备多头计算能力,本人水平不高,个人代码未经验证,有问题和建议欢迎指出。CoPE代码为代替LlamaModel中的RoPE而设计,因此函数名称类似于LlamaModel的RoPE,但实际功能略有不同,有待商
  • 2024-04-09深度探索:机器学习Deep Belief Networks(DBN)算法原理及其应用
    目录1.引言与背景2.定理3.算法原理4.算法实现5.优缺点分析优点:缺点:6.案例应用7.对比与其他算法8.结论与展望1.引言与背景深度学习在近年来取得了显著进展,其在图像识别、语音识别、自然语言处理等多个领域的成功应用引发了广泛的关注。其中,DeepBeliefNetworks
  • 2024-04-02LLM面面观之MoE
    1.背景根据本qiang~最新的趋势观察,基于MoE架构的开源大模型越来越多,比如马斯克的Grok-1(314B),Qwen1.5-MoE-A2.7B等,因此想探究一下MoE里面的部分细节。此文是本qiang~针对大语言模型的MoE的整理,包括原理、流程及部分源码。2.MoE原理MoE的流行源于”欧洲的OpenAI”Mistral
  • 2024-03-19Python 机器学习 HMM模型三种经典问题
    ​ 隐马尔可夫模型(HiddenMarkovModel,HMM)是一个强大的工具,用于模拟具有隐藏状态的时间序列数据。HMM广泛应用于多个领域,如语音识别、自然语言处理和生物信息学等。在处理HMM时,主要集中于三个经典问题:评估问题、解码问题和学习问题。三个问题构成了使用隐马尔可夫模型时的基础