首页 > 其他分享 >复杂系统 | 20240116 · 考试题目回忆版

复杂系统 | 20240116 · 考试题目回忆版

时间:2024-02-06 10:46:19浏览次数:24  
标签:题目 答错 Iteration 证明 RL 20240116 theorem policy 考试


相关链接:


十个判断题,感觉都是正确的()

十个选择题,应该也算比较基础,考到了 EBO 和什么 steady state distribution,什么 estimate interval \((1/t)^{1/2}\) 收敛之类。

(btw 这次客观题答错不扣分;jls 当时说,想答错扣分,保证 random policy 的得分期望为 0… 幸好后来没有实施)

有三个大题,第一个是 alias method 画表 + 数归证明。

第二个是 policy gradient theorem,第一问给出形式,第二问证明。(没复习 policy gradient theorem,现场推的东西是错了,完蛋…)

第三个是给出并证明 Little's Law。



标签:题目,答错,Iteration,证明,RL,20240116,theorem,policy,考试
From: https://www.cnblogs.com/moonout/p/18009308

相关文章

  • 经典数据结构题目-图
    图200.岛屿数量思路遍历二维数组,遇到等于1的进行计算。同时修改同岛的位置为0,避免重复计算遍历同岛的位置,可以采用dfs深度优先搜索代码char[][]g;publicintnumIslands(char[][]grid){intsum=0;g=grid;for(inti=0;......
  • (python)做题记录||2024.2.4||题目是codewars的【 All Balanced Parentheses】
    题目链接:https://www.codewars.com/kata/5426d7a2c2c7784365000783/python我的解决方案:defbalanced_parens(n):#Yourcodehere!used_l=[Falseforiinrange(n)]used_r=[Falseforiinrange(n)]answers=[]defprocess(answer):iflen(a......
  • 2024牛客寒假算法基础集训营1 K 牛镇公务员考试 题解
    Question2024牛客寒假算法基础集训营1K牛镇公务员考试给出一张试卷有\(n\)道单选题,每道题用一个整数\(a_i\)和一个长度为\(5\)的字符串\(s_i\)表示,其中第\(i\)道题的题面为:第\(a_i\)道题的答案是()A.\(s_1\)B.\(s_2\)C.\(s_3\)D.\(s_4\)E.\(s_5\)问:正......
  • (python)代码学习||2024.2.3||题目是codewars上的【Validate Sudoku with size `NxN`
    题目的要求是写一个Sudoku类,类中要有一个实例函数判断传给对象的二维数组是否符合数独规则题目链接:https://www.codewars.com/kata/540afbe2dc9f615d5e000425/python下面是写完题后看到的别人的解决方法fromitertoolsimportchainclassSudoku(object):def__init__......
  • 基础算法(八)前缀和模板---以前缀和题目为例
    题目如下输入一个长度为 n的整数序列。接下来再输入 m个询问,每个询问输入一对 l,r。对于每个询问,输出原序列中从第 l 个数到第 r个数的和。输入格式第一行包含两个整数 n 和 m。第二行包含 n 个整数,表示整数数列。接下来 m 行,每行包含两个整数 l 和 r,......
  • 双指针秒杀七道数组题目
    删除有序数组中的重复项简单解释一下什么是原地修改:如果不是原地修改的话,我们直接new一个int[]数组,把去重之后的元素放进这个新数组中,然后返回这个新数组即可。但是现在题目让你原地删除,不允许new新数组,只能在原数组上操作,然后返回一个长度,这样就可以通过返回的长度和原......
  • 双指针技巧秒杀七道链表题目
    合并两个有序链表我们的while循环每次比较p1和p2的大小,把较小的节点接到结果链表上,看如下GIF:形象地理解,这个算法的逻辑类似于拉拉链,l1,l2类似于拉链两侧的锯齿,指针p就好像拉链的拉索,将两个有序链表合并;或者说这个过程像蛋白酶合成蛋白质,l1,l2就好比两条氨基酸,而指......
  • 2024.1.31题目选讲
    CF1753C首先求出整个数列有多少个0,设为sum0,再求出\(1--sum0\)中有多少个1,设为\(sum1\)显然,我们的目标就是把\(1--sum0\)中全部变成0那么考虑有意义的一步的期望次数,由于线性性,可以全部加起来设左边还有x个1(左边就是\(1--sum0\))交换到的概率为\(\dfrac{x^2}{n(n+1)/2}\),那么......
  • 题目:陆地上的地壳主要成分是什么元素
    问题:陆地上的地壳主要由长石和石英等矿物组成,主要成分是()元素。A.氧、钙、铁B.氧、硅、铝C.钙、铁、硅D.氧、铁、硅参考答案如图,发送题目到公众号学哈,秒回答案......
  • 最新大专考试题目搜题软件?如何选择一款适合大学生使用的搜题工具?
    作为当代大学生,我们常常面临着繁重的学业压力和众多的学习任务。在这个信息爆炸的时代,如何高效地进行搜题和学习成了我们迫切需要解决的问题。幸运的是,随着科技的不断进步,我们拥有了许多方便、实用的日常搜题和学习软件。1.百词斩百词斩是针对英语学习开发的一款“图背单词软件”,软......