论文5个部分,本篇主要是针对3-14日组会中,懂和不懂的地方进行记录。
论文部分:
①RAID(待补充)
②DC(data collector)数据收集器 + 重建节点
所有的这些系统,最基本的是要保证“DC”功能,也就是数据收集;在这个基础上,再保证,假如某节点出问题,能否修复;再研究 ,怎么修复代价最小,代价又分很多,有修复带宽,有存储空间。
所以,论文这个部分得出的这个结论:k ≤ d ≤ n − 1
d为什么要大于等于k呢,因为编码的理论告诉我们,如果要想满足数据收集的功能,那就必须要保证,至少要有k个节点,才能得到全部的数据,所以,d要大于等于k;如果d小于k了,那根据这d个数据,根本不能得到数据,那连最基本的都无法保证了。
d为什么要小于等于n-1呢,因为最多就n个节点,那么坏掉一个,剩下n-1个被用来修复,最多也就n-1个节点参与修复了。
这些参数的意义:
n:整个系统中,一共的节点个数,可以对应到,编码领域的n。
k:在编码理论中,代表的是信息位数,这里可以理解为,原始节点(没有经过编码过)。
d:代表参与修复的节点个数。
α:每一个节点,子分组化级别。
β:从每一个节点中,下载的数据量,有β≤α。
B:整个文件的大小。
③ 图的理解
前人得到的这个式子,这个式子什么意思呢,可以理解为,要下载一个1GB的电影(B),需要从系统下载的数据量一定要大于1GB(右边的∑),如果这个不等式的等号成立,我们可以得出,1GB的电影,最少要到系统下载1GB的数据,也就是得到了下面这个图。
这个图上的这条曲线,只要在曲线上的点,都满足1GB=1GB这个关系,也就是最小的下载量,我们接下来讨论的,就是在等号成立的条件下(在图的曲线上的点),满足不同条件的点。
标签:Repair,Codes,修复,编码,论文,Storage,1GB,节点 From: https://www.cnblogs.com/KeithTee/p/18073373