• 2024-06-06【机器学习】应用深度Q网络(DQN)在Atari Breakout游戏中实现智能体
    1.绪论1.1DQN是什么?DeepQ-Learning,也被称为DeepQ-Network(DQN),是一种结合了深度学习和Q-Learning的强化学习算法。以下是关于DeepQ-Learning的详细解释:背景介绍:-强化学习是一种机器学习方法,使智能体能够通过与环境互动来学习最佳行为。智能体在环境中执行动作,并接
  • 2024-05-27【强化学习】强化学习基础教程:基本概念、强化学习的定义,要素,方法分类 以及 Rollout、episode回合、transition转移、trajectory轨迹的概念
    【强化学习】强化学习基础教程:基本概念、强化学习的定义,要素,方法分类以及Rollout、episode回合、transition转移、trajectory轨迹的概念1.基础概念1.1强化学习的定义1.2强化学习的基本要素2.强化学习分类2.1根据agent学习方式分为基于策略的强化学习PolicybasedR
  • 2024-05-14【编译器001-001】总览
    参考资料BuildingaCompiler国内搬运[中英字幕]C#构建编译器(BuildingaCompiler)代码地址:https://github.com/terrajobst/minsk具体思路这个作者使用的是dotnet,而我对dotnet不怎么感冒,所以我的方式是先使用dotnet跟着抄一遍,然后使用自己喜欢的语言写一
  • 2024-03-17蒙特卡罗智能体
    CartPole问题不一定非要使用成熟的强化学习方法和一些神经网络来解决,本节介绍了基于蒙特卡罗模拟的问题的简单解决方案,并使用了降维的特定策略。在这种情况下,定义环境状态的4个参数通过线性组合被压缩为了单个实值参数。2以下Python代码实现了这个想法。In[18]:np.
  • 2024-03-13【强化学习笔记一】初识强化学习(定义、应用、分类、性能指标、小车上山案例及代码)
    文章目录第1章初识强化学习1.1强化学习及其关键元素1.2强化学习的应用1.3强化学习的分类1.3.1按任务分类1.3.2按算法分类1.4强化学习算法的性能指标1.5案例:基于Gym库的智能体/环境接口1.5.1安装Gym库1.5.2使用Gym库1.5.3小车上山1.5.3.1有限动作空间1.5.3.2
  • 2024-02-16NumPyML 源码解析(五)
    numpy-ml\numpy_ml\preprocessing\nlp.py#导入必要的库和模块importreimportheapqimportos.pathasopfromcollectionsimportCounter,OrderedDict,defaultdictimportnumpyasnp#定义英文停用词列表,来源于"GlasgowInformationRetrievalGroup"_STOP_WORDS=
  • 2024-02-01获取动漫并播放
    importrequestsfrombs4importBeautifulSoup,NavigableString,Tagfromfake_useragentimportUserAgentBASE_URL="https://ww1.gogoanime2.org"#BASE_URL="https://search.bilibili.com"defsearch_scraper(anime_name:str)->list:
  • 2024-01-18玩玩算法题——Episode 3
    Leetcode2171.拿出最少数目的魔法豆(2024-1-18每日一题)StarRating:4.03提示给定一个正整数数组beans,其中每个整数表示一个袋子里装的魔法豆的数目。请你从每个袋子中拿出一些豆子(也可以不拿出),使得剩下的非空袋子中(即至少还有一颗魔法豆的袋子)魔法豆的数目相等。一旦把魔
  • 2024-01-18玩玩算法题——Episode 2
    Leetcode每日一题:最大字符串匹配数目题干如下:给你一个下标从0开始的数组words,数组中包含互不相同的字符串。如果字符串words[i]与字符串words[j]满足以下条件,我们称它们可以匹配:字符串words[i]等于words[j]的反转字符串。0<=i<j<words.length请你返回数组
  • 2023-12-16值迭代与策略迭代(有模型)
     先说一下我初始理解,就是图片上面有三部曲,然后他是一个有模型的算法,然后假如说我让他训练100次就是,用python来表达就是forepisodein(100),这个就是最外面的那一层循环,然后每次episode,就是上面三部曲,但是第一步初始化环境是会根据上一个episode来变化的,从第一个episode开始讲
  • 2023-11-19gpl查询规范
    仅仅是规范,不是具体实现,需要各种语言来实现.1.字段(Fields):①.请求结构中包含了所预期结果的结构,这个就是字段.a.可以让请求发起者很清楚的知道自己想要什么.②.响应的结构和请求结构基本一致.③.举例:{hero:{idname
  • 2023-07-04强化学习实践:Policy Gradient-Cart pole游戏展示
    摘要:智能体agent在环境environment中学习,根据环境的状态state(或观测到的observation),执行动作action,并根据环境的反馈reward(奖励)来指导更好的动作。本文分享自华为云社区《强化学习从基础到进阶-案例与实践[5.1]:PolicyGradient-Cartpole游戏展示》,作者:汀丶。强化学习
  • 2023-06-22python写的一个脚本,在电脑运行。可以实现 手机端在线通过url观看电视
    python脚本,需要安装pipinstallflashpipinstallflash_restful fromflaskimportFlask,send_from_directoryfromflask_restfulimportApi,Resourceapp=Flask(__name__)api=Api(app)classTVSeriesResource(Resource):defget(self,episode):
  • 2023-03-314
    letDEFAULT_CONFIG={//配置初始化initialized:true,//开发者模式developer:false,//分辨率宽高比aspect_ratio:"",//缩放比率,当前分辨率和采样分辨率之比scale_ratio:1,//全局找图精度threshold_all:0.9,//最大运行次数,超出次数直接结束max_running_tim
  • 2023-03-21Episode 10
    MapConnectivity——地图连通性MapGeneratorusingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;publicclassMapGenerator:MonoBeh
  • 2023-03-21Episode 11
    MapNavigation——地图烘培MapGeneratorusingSystem.Collections;usingSystem.Collections.Generic;usingUnity.VisualScripting;usingUnityEngine;publiccla
  • 2023-03-21Episode 12
    FinishingtheMapGeneratorMapGeneratorusingSystem.Collections;usingSystem.Collections.Generic;usingUnity.VisualScripting;usingUnityEngine;publiccl
  • 2023-03-21Episode 08
    TileMap——地图MapGeneratorusingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;publicclassMapGenerator:MonoBehaviour{p
  • 2023-03-21Episode 09
    ObstaclePlacement——障碍物生成UtilityusingSystem.Collections;publicstaticclassUtility{//洗牌算法publicstaticT[]ShuffleArray<T>(T[]arra
  • 2023-03-12Electric vehicles _ Episode 4 - Battery Management Systems
    Inthisvideo,wearegoingtoexplaintheroleofthebatterymanagementsystem,alsoreferredasBMS,inefficientlymanagingandcontrollingthebatteries.He