首页 > 其他分享 >关于ManyCore的一些讨论

关于ManyCore的一些讨论

时间:2023-06-18 14:04:03浏览次数:34  
标签:讨论 core Cache cache 关于 一致性 coherence ManyCore 异构


T-MCer 说:
Bad News:虽然我们认为采用ncc NUMA来解决cache coherence的问题,但目前还很难找到有相关研究认为未来的multi core应该取消cache coherence的限制,do you have any info.?

Ray 说:
我昨天看Tilera(100core)的产品说明,他们也保证cache一致性:

Tilera's DDC™ (Dynamic Distributed Cache) system for fully coherent cache across the tile array enables scalable performance for threaded and shared memory applications.
 
T-MCer 说:
 是的,无论是学术界还是工业界,不管core增加到多少,他们对cache coherence始终没有松口

Ray 说:
 通过看Intel这篇文章, Thousand Core Chips—A Technology Perspective , 我觉得有可能走片内异构的路。
 它说Core多了之后,会做大小不同的各种core在一个片内
 我个人想,也许会做局部Cache一致性。

T-MCer 说:
 片内异构这些年炒得比较火,Tong Li那篇文章就是说的异构OS的设计
 如果没有cache coherence,那就相当于一个片上机群,或者片上MPP系统
 而我们的异构跟他们的异构是有差别的,我们的ISA不同,无法做migration等,我们又不能做Binary Translation
 因此,HPP的异构对OS来说,比较尴尬
 不过,如果能将不支持片内全局cc的OS做得跟支持cc的一样,那也是一种创新
 如果花了很大力气无法与many core靠近,那也可以就事论事,就是基于HPP,挖掘它的特点

 



mail discussion:

 

主题:  Re: Re: 资料
日期:  Fri, 7 May 2010 10:34:22 +0800


在多核/众核结构中,由于芯片面积大,监听的一致性协议实现比较困难;而目录协议的性能相对比较好,但是核越多,目录的硬件开销也越大。我记得看过一篇文章,提到在多核系统中,处理器核数目多的时候,目录所占的Cache面积比例非常大,(这篇文章找不到了,昨天晚上就在找,实在是想不起来文章的题目了)。
如果使用私有的Cache、并且在私有Cache中缓存共享可读写的数据,就需要维护一致性,但是不一定完全用硬件来维护。现在几款众核处理器中,Tile系列是软硬件协同的目录协议,实现方法是通过操作系统或Hypervisor找到数据块的宿主结点(home),在home结点上会有目录,通过目录实现Cache一致性协议。而Intel的单芯片云计算机SCC芯片,使用的是MPI编程,没有一致性的问题。我们实现的T中,在私有Cache中也可以缓存共享的数据,由于考虑到纯硬件支持一致性协议比较复杂并且开销大,就实现了李凯老师提出的Scope Coherence,这相对增大了程序员编程的难度。但是,我觉得软硬件协同的Cache一致性协议是一种必要的发展趋势。
或者,还有一种硬件实现方式,就是对于共享可读写的数据不在私有Cache中缓存,而只在共享Cache中缓存,这需要程序员指定哪些数据是共享可读写的,这种情况就可以不支持一致性了。
如果说的不清楚,我们再交流。

   
============================================================
------ 2010-05-06, 18:48:46, you have writen about:------
Date(发送日期):2010-05-06 18:48:46
Subject(主题):Re: 资料

最近看了几篇对multi core的性能评测,其中提到在多核尤其是未来的众核系统
中,维护Cache coherence带来的overhead会很大,也可能会称为性能的瓶颈,所
以我想了解一下,在未来的研究趋势中,是否会取消在many core之间支持全系统
的cache coherence?目前是否有这方面的研究?

标签:讨论,core,Cache,cache,关于,一致性,coherence,ManyCore,异构
From: https://blog.51cto.com/maray/6508343

相关文章

  • 关于建立专家Twitter社区的一种想法
    阅读Linux源码过程中发现很多细微末节的函数都没有注释,在作者看来可能微不足道,但是从源码阅读者看来却是个坎。 网上有那种网站,把linux很多API都做了详细的解释,但是做得还不够:那些解释定位于面向驱动开发者,只提供了数量有限的API的解释。对于那些细微末节的函数,确只字未提。 为什......
  • 关于sar的学习
    关于sar的学习背景公司一套基于某冷门Python架构的系统前几天出现异常卡顿.当时安装的时候必须使用ubuntu系统.所以当时默认安装的ubuntu1804,本来想尝试使用一下sar查看卡顿时期的系统状况但是发现没有默认安装.并且最近虽然有node-exporter以及prometheus和grafana但......
  • 关于Spring Security
    工作原理SpringSecurity所解决的问题就是安全访问控制,而安全访问控制功能其实就是对所有进入系统的请求进行拦截,校验每个请求是否能够访问它所期望的资源。根据前边知识的学习,可以通过Filter或AOP等技术来实现,SpringSecurity对Web资源的保护是靠Filter实现的,所以从这个Filter来......
  • 关于如何使用C++进行编程(不使用数据库的情况下)
    问题描述对于一个长期使用Java连接数据库,实现javaweb编程的软工友友来说,突然在编程任务中不允许连接数据库,就有一点的蒙圈,没有办法,只能去查阅资料啦!问题解决不出意外的话,这次我们就需要使用文件操作来存储数据啦!(然后另外一种方法时json,显然,文件操作更加简单一点、也是更加熟悉......
  • 关于 SAP Commerce Cloud UI 的混合部署模式
    所谓混合部署模式,意思是CommerceCloudStorefront部分UI通过Spartacusserve,剩下的仍然通过传统的Accelerator来serve.例子:http://localhost:4200/electronics-spa/en/USD/Open-Catalogue/Cameras/Digital-Cameras/c/575通过Spartacus实现http://localhost:4200......
  • 关于uni-app与vue路由配置的不同,不使用uni.navigateTo接口跳转时,使用this.$router.pus
    之前用vue写router路由的时候,先配置一个路由表,然后再将配好的路由push到已有的组件里面,再通过<RouterView></RouterView>方法将每一个调用的路由的内容渲染到父组件要用的位置。今晚我在用uni-app的时候,突然不想用uni-app自己提供的路由跳转方法:uni.navigateTo我想用vue那种路由......
  • 关于DFS
    概述所谓深度优先搜索(以下称为dfs,depthfirstsearch),这个高尚的名字,它是什么呢?我认为,他是一种借助计算机计算能力的枚举。是一种选优搜索法,又称为试探法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再......
  • 关于递归与分治
    关于递归众所众知,递归是思想而不是算法。从古至今,尽管人脑很高级,但好像人脑天生不适合模拟递归。它为什么难以被理解呢?我认为是它的这种自身调用自身的方式看似简单,但是实际上会建立一棵庞大的搜索树。人脑由于容易出错,而递归又是建立在上一层基础上的,所以可能越错越深。那它......
  • 关于BFS
    BFS目录Content概述问题思考与性质典型应用优化与扩展Part1概述I.什么是BFS?广度优先搜索(breadthfirstsearch),是以同层可达状态优先,一层层向外扩展的搜索算法。一般以队列实现II.算法基本结构图源:CSDN@sigdIII.动画过程演示通常,bfs会用在遍历图,下面的图生......
  • 关于KMP
    关于KMP平凡,而又不平凡的一天,12月31日,2022年的最后一天,让我们用几句代码迎接新年的到来。cout<<"Goodbye2022\n";printf("Hello2023!");扯正题。Kmp的简介KMP算法是字符串匹配算法,基础的用途是在文本串中快速查找与模式串相匹配的位置。一些感想我们在研究这个算法的......