• 2024-06-08一文看懂llama2(原理&模型&训练)
    自从Transformer架构问世以来,大型语言模型(LargeLanguageModels,LLMs)以及AIGC技术的发展速度惊人,它们不仅在技术层面取得了重大突破,还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出,这一技术日益走进大众视野,这也预示着一个由生成式AI塑造的未来正在加速
  • 2024-05-15PPO-KL散度近端策略优化玩cartpole游戏
     其实KL散度在这个游戏里的作用不大,游戏的action比较简单,不像LM里的action是一个很大的向量,可以直接用surr1,最大化surr1,实验测试确实是这样,而且KL的系数不能给太大,否则惩罚力度太大,actionmodel和refmodel产生的action其实分布的差距并不太大 importgymimporttorchimp
  • 2024-01-05R语言中的马尔可夫区制转移(Markov regime switching)模型|附代码数据
    原文链接:http://tecdat.cn/?p=12187原文出处:拓端数据部落公众号最近我们被客户要求撰写关于马尔可夫区制转移模型的研究报告,包括一些图形和统计输出。金融分析师通常关心检测市场何时“发生变化”:几个月或至几年内市场的典型行为可以立即转变为非常不同的行为。投资者希望及时
  • 2023-12-1110行Python代码能做出哪些酷炫的事情?
    Python凭借其简洁的代码,赢得了许多开发者的喜爱。因此也就促使了更多开发者用Python开发新的模块,从而形成良性循环,Python可以凭借更加简短的代码实现许多有趣的操作。下面我们来看看,我们用不超过10行代码能实现些什么有趣的功能。一、生成二维码二维码又称二维条码,常见的二维码为QR
  • 2023-04-26利用pytorch深度学习框架验证骰子的合格性
    利用pytorch深度学习框架验证骰子的合格性骰子生产的合格性可以用概率来表达,比如每个面出现的概率大概都是1/6。importtorchfromd2limporttorchasd2lfromtorch.distributionsimportmultinomial#多次扔骰子出现每个面的概率服从多项式分布fair_probs=torch.ones(
  • 2022-11-22《动手学强化学习》笔记
    课本链接Multi-ArmedBandit伯努利Multi-ArmedBanditimportnumpyasnp#支持数组和矩阵运算的库importmatplotlib.pyplotasplt#绘图库classBernoulliBa
  • 2022-10-04Python两层神经网络
    参考神经网络15分钟入门——使用python从零开始写一个两层神经网络_Mr.看海的博客-CSDN博客_神经网络入门python #参考https://blog.csdn.net/fengzhuqiaoqiu/arti