• 2024-07-18[强化学习]--悬崖漫步
    Q-Learning是一种在强化学习中广泛应用的算法,它属于值迭代方法的一种,能够通过与环境交互来学习最优策略。Q-Learning的核心思想是学习一个动作价值函数(Q-Function),这个函数可以预测从某个状态采取某个动作后所能获得的长期奖励。1、Q-Learning的基本原理Q-Learning的目标是找
  • 2023-10-11冲刺只能跑100米 漫步却能走一万步或一万米
    飘风不终朝 骤雨不终日。意思就是说,狂风不会刮一个早晨,暴雨也不会下一整天。真正能够长久下去的,是梅雨季节的绵绵细雨。努力,不应该是一种时刻需要提醒自己去做的事情,而是一种早已嵌入生活中的习惯。短暂地刻意奔跑,只会迅速消耗完你的精神能量,然后让你迅速变得萎靡不振。相信
  • 2023-06-08科技云报道:都是科技与狠活儿!工业软件如何“云端漫步”?
    科技云报道原创。二十年前,当云计算和SaaS软件应用模式刚被作为未来的IT趋势时,工业软件就开始了自身“云化”的探索,直到今天也未停歇。这其中有一个问题始终需要回答:到底怎样才是真正的“工业软件云化”?是从技术上,将原本桌面部署的工业软件改为云端部署?还是从商业逻辑上,从购买许可证
  • 2023-04-18纪录片|数学漫步之旅
  • 2022-10-12一场漫步园林之梦的视听盛宴
    北京的四合院,苏州的园林,一北一南,古老的京杭大运河将其贯穿,形成了中国传统建筑中,最具地域特色的文化符号,或古朴厚重、大气磅礴,或空灵雅致、小巧灵秀,历经千百年,彼此守望,默默致
  • 2022-09-24【闲散漫步】水题日记
    \(\textrm{luoguP1306斐波那契公约数}\)斐波那契结论题:\[\gcd(F_n,F_m)=F_{\gcd(n,m)}\]\(\textrm{luoguP1445[Violet]樱花}\)简单的计数。\(\textrm{luoguP21