论文阅读：基于强化学习的数据中心冷却控制

标签：数据中心 network 论文 policy 冷却 action CCA 温度

全文主旨【省时间快读】
0 abstract
1 intro
2 related work
- 2.1 related work： DC 冷却优化
- 2.2 related work： RL（DRL）
3 冷却优化问题定义
- 3.1 基于 EnergyPlus 仿真的 RL 模型
- 3.2 Problem Statement
4 method
5 评测：simulation
6 评测：真实数据
- 6.1 实验准备
- 6.2 实验结果（包含 DUE）
7 conclusion

全文主旨【省时间快读】

写在前面：

本次全文快读，使用了 Dmitry Berenson 的读论文方法（感觉很实用，所以特意写了一篇博客）。
论文标题：Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning，用深度强化学习做数据中心冷却的优化。发表于 2019 年，已经被引 116 次。
不清楚这篇 2019 年的论文是否算 RL 做此类优化的早期工作；
- Google Scholar 上，最早的相关工作是在 2017 年，18 年开始变多；
- 除了数据中心冷却之外，建筑的 HVAC（Heating Ventilation and Air Conditioning，供暖通风与空气调节）也比较多。
最后，这篇博客是我断断续续写了将近两个月才发出来的，中间跑去实习、又跑去保研、学运筹学、干各种事情，一直搁置到现在。
- 前几天有在读《Lessons from AlphaZero》，并且参加一些组会，对自动化有了一些新的认识。现在看来，下文的博客内容，可能有些太激进、过于偏颇了。
- 对于我的个人观点，读者随便看看就好。RL 是否纯粹，可能没那么重要，重要的是我们把问题解决了，这就足够了。

layer 1：知道 main idea

【问题定义】作者试图解决 / 研究什么类型的问题 / 现象？
1. 我们希望帮助数据中心节能。数据中心的能耗主要分为三部分：① 电脑跑程序的能耗，② 冷却电脑的能耗，③ 房间照明、监控等其他 misc 事情（一般不考虑）。
2. 然而，我们不能影响数据中心的任务调度（比如 A 机器已经很忙了，再干活就过热了，所以把任务强行塞给 B 机器），只能影响冷却系统（比如空调、冷却水等），控制冷却系统的功率、运作方式等。
3. 我们的目标是：合理控制冷却系统，使得 ① 机器不过热 ② 能耗尽量小。
【问题重要性】读者为什么要关心这个问题 / 现象？
1. 因为数据中心耗能很多，冷却耗能占一大部分，所以，如果能节省 15% 的冷却耗能，就已经是很大一笔。
【novelty】proposed method 与 previous works 有什么不同？
1. previous works：一般采用 two-step 的形式，先（基于物理方程、专家经验等）建 DC 的模型，再基于进行控制。
2. proposed method： end-to-end、RL-based method（虽然感觉 proposed method 不算典型 end-to-end，并且也不能算是典型 RL）。
【为何胜出】比 previous works 好在哪里？（比如性能更好 / 更 general / 更快）
1. general：用 neural net 代替一些模块，可以省去很多物理建模的复杂度吧。（但是随之而来的调参复杂度，不知道怎么样）
2. 性能：貌似在某些情况下，性能＞baseline（一个魔改的 two-step method）。
【论文在文献树上的位置】这是什么类型的方法？（通常有几种方法可以解决相同的问题）
1. 文中有提到传统的 two-step 解决方案，先物理建模数据中心，然后再 somehow 给出控制信号。
2. 月出个人猜测，还会有一些用 ai 取代部分模块的方案，比如神经网络建模数据中心、启发式算法跑出控制信号。
3. 这篇论文提出了全部采用 ai 技术的方案，并且采用了类似 RL 的框架。
【实际应用】这项工作有哪些应用？
1. 用来给出更好的控制，或者控制参考建议。
2. 不过在这方面有个隐忧：如果 ai 的可靠性 / 可解释性不足够，万一对于某些状态，给出了很离谱的控制。
3. 感觉我们可以添加一个安全性模块，用来拦截住离谱的控制信号，或者做一些 model ensemble，进行一个去除最大最小的 voting。
4. 不过，那天导师说我们项目采用人工闭环，也就是程序仅提供一个控制的参考值，这是因为自动控制太贵了，人工控制便宜一点
  标签：数据中心,network,论文,policy,冷却,action,CCA,温度
  From： https://www.cnblogs.com/moonout/p/16769669.html

论文阅读：基于强化学习的数据中心冷却控制

全文主旨【省时间快读】

layer 1：知道 main idea

相关文章

赞助商

阅读排行