首页 > 其他分享 >AMD记录

AMD记录

时间:2023-06-11 14:11:54浏览次数:75  
标签:记录 性能 AMD 网卡 内存 CCD CPU

CXL

 

rust

SP3 服务器设计 主板设计规格

chiplets 架构

大芯片  Monolithic 架构 CPU增长,会有性能瓶颈,

多片封装架构,采用四个晶圆

3D 堆叠技术

 

32MB-》96MB

 

主频  cyclye 周期的关系

 

AMD 3D chiplet 封装技术,让 三级缓存更大

CCD zhichi 8 个 core

 

GENOA-XBERGAMO 第四代

TURIN Dense 

 

pcore ,ecore

 

CCD - CCX

 

EDA

 

成本:

Intel 设计+晶圆厂

AMD 设计+代工+封测(马来 苏州 通富微电封测),AMD 已经把晶圆厂卖掉了,谁先进用谁

AMD EPYC

行业现状:

  

 

最低内存延时 单晶元

算力、多晶圆(内存延时高)

罗马、米兰

SOC设计思路,没有南北桥,内存控制器,集中到IO带,

罗马、米兰(时钟不同步)

调优思路:

BIOS

内核

OS

NUMA

应用程序

 

目前我们用单路 也就是 单个CPU,性能耗时-》片之间的跳转,CCD之间跳转

set irq 网卡中断绑定

BIOS

  为什么使用Auto?代表特定的值,例如CCD数量

  SMT 打开超线程

todo 待办

  CPU C-state 省电、节能(节能关闭)  P-state 性能管理状态(要性能)

最大超频频率AMD == 睿频intel

 

 

NPS numa nodes per socket

ROMA,一个cpu,一个numa,一颗cpu每个象限作为一个节点,默认一个cpu一个节点

nps1    内存延迟高、8通道一起操作

nps4     一个numa node 内存延迟低,两个内存通道,

 

内存控制器,注重频率

TSME 内存加密技术

SEV docker 的内存加密

gcp 开启了这个加密

 

NBIO 北桥

IOMMU 虚拟化 地址转换

SMU 性能相关

  Determinim slider 设置决定模式2

  Auto

  Power 电源模式,性能发挥到最大,

  performance 性能决定模式 木桶原理,不同芯片之间性能一致  (docker 模式下推荐)

APBDIS(电源管理) io超频 uncore  

动态调节频率,CPU内的延时增加

降低最高频率值的设置,可能不同的时刻 分配同一个

 

 

preferred IO IO优先处理的方式,百G 以内 set irq affnity  lstop numa node 网卡,让网卡中断平均到多个核心上

每次轮训的时候,让他先走,网卡,磁盘这种

BUSID 填到这里

缺点,只能有一个网卡,保证这个网卡的优先级,两个网卡不可以

SSD是一组是一样的

 

ROMA Milan 内存带宽比较 349GB/s | 

ROMA 不支持6内存通道,只支持 4/8 通道

Milan 支持6通道

Intel 是6内存通道

 

 

8+1D 64core

4+1D 32core

1D io带

llc / 32 几个ccd

 

 

内存延迟调优

两片150ns 调理之后 Intel90ns

 

内核 kernel

os

 

rust 内核 硬件 hardware err

 

照片:

docker 应用调优

os grub iommu=pt,nohz=off 一定要打开

os 查看电源管理

os 关闭C-stat,即禁止进入休眠状态(ms级别的)

 

hadoop network config 

 

照片

避免CPU 片之间的切换

是否绑定核心

 

QOS lllc  Roma的分配单位是ccx为单位

 

大数据方向,AMD很强,比Intel强

关于 软中断的点(我们也可以借用)

 

PCIE 通道多,AI训练

 

AI推理(AI-INFERENCE)

每个CPU下面挂在102个GPU和一个网卡,可以不使用PCIE-Swith,可以直连

 

NVIDIA GPU 

chartGPT 用 微软的云进行测试,底层用的AMD定制化芯片

 

AMD支持Anolis

 

第一代 nps4

 

intel 需要大核心

AMD 需要小核心,组成大的核心

 

 

AMD功耗低,

 

单核整型及浮点算力

 

我国有自己的能耗标准,炭效白皮书

 

tecnet 60% AMD

标签:记录,性能,AMD,网卡,内存,CCD,CPU
From: https://www.cnblogs.com/wangfancrazycity/p/17472879.html

相关文章

  • Linux服务器配置SSH免密码登录后,登录仍提示输入密码(一次真实的问题排查解决记录)
    我们知道两台Linux服务器机器之间如果使用ssh命令登录或scp/rsync命令传输文件每一次都需要输入用户名相对应的密码,如果要免密码,则需要对两台Linux服务器机器之间进行SSH互信。一.SSH介绍1.SSH互信原理虽然这是废话,也希望大家了解一下。SSH(SecureShell)是一种安全的传输协议,它可以......
  • ubuntu安装docker 记录
    2023.6.11上午sudoaptinstalldocker-io//安装systemctlstatusdocker//查看运行状态sudodockerrunhello-world//测试 为学习操作系统做准备,在docker中运行 docker安装以下 nasmgccbinnutilsqemu-system-i386mtools//《30天自制操作系统》......
  • 【做题记录】ADAUNIQ - Ada and Unique Vegetable
    link做法:带修莫队#include<cstdlib>#include<cmath>#include<cstdio>#include<cctype>#include<algorithm>typedeflonglongLL;typedefunsignedlonglongULL;namespaceFastIo{typedef__uint128_tULLL;staticcharbuf[10......
  • VideoEye源码编译错误记录
    最近在研究雷神的开源项目VideoEye,但是下载编译时用VS2013和VS2015都出现一些报错。分析是因为雷神调试的环境是VS2010,现在使用新版本VS编译时存在不兼容的问题。网上查找各种信息,最终问题得以解决,于是乎记录一下。【背景】项目地址http://git.oschina.net/leixiaohua1020/Vid......
  • 记录一次新手渗透的过程
    这是严格意义上的第一次动手实操,相对于无限的理论学习与记忆,我个人是觉得让我动手操作一次让我的收获更大。目标靶机:http://testphp.vulnweb.com/工具使用:KaliLinux参考文档:   【渗透测试】渗透测试最强秘籍(Part1:信息收集)–绿盟科技技术博客(nsfocus.net)明确目标之......
  • 算法刷题记录:P1518 [USACO2.4]两只塔姆沃斯牛 The Tamworth Two
    题目链接:https://www.luogu.com.cn/problem/P1518题目分析这道模拟题很典型了,给定了一个固定的移动方式,去模拟即可,该题说:如果牛和农夫永远不会相遇输出0,我没想到很好的方法,不推荐我这样的写法。算勉强AC吧。AC代码//Problem:P1518[USACO2.4]两只塔姆沃斯牛TheTamwort......
  • 收集一些运营商PPPoE拨号失败的返回信息记录以及拨号上网的历史
    PPPoE拨号失败在不同系统返回表现差异很大,有的系统可以得到相当详细的信息,而有的系统连678691这种最简单的返回都不会有。691>678,很显然,678数字比较小,一般是较前的步骤。如果网线没有连接好,或者“本地连接”被禁用,网卡驱动没有安装之类的无网络通信的状态试图拨号,会很快,或者很漫长......
  • blog不只有技术,记录下生活也不错
    今日十三陵水库骑行,想着要出去溜溜直接就出发了,出门才想起忘了带心率带和手套,真就休闲骑了,要不我想冲下50试试,怕心率爆了没敢试首个50公里真舒服......
  • 算法刷题记录:P1328 [NOIP2014 提高组] 生活大爆炸版石头剪刀布
    题目链接https://www.luogu.com.cn/problem/P1328题目分析是一道和环有关的问题,直接模拟即可AC代码//Problem:P1328[NOIP2014提高组]生活大爆炸版石头剪刀布//Contest:Luogu//URL:https://www.luogu.com.cn/problem/P1328//MemoryLimit:125MB//TimeLimit......
  • 一个经验记录matlab中disp的应用
    一、题目:一个给定离散系统闭环传递函数为G1(z)=(Z^2+4.2Z+5.43)/(Z^4-2.7*Z^3+0.4*Z^2+0.08Z+0.002),采样周期为0.1s,绘制系统零极点分布图,并判定各系统的稳定性。二、代码如下:functionsystemStabilityJudge1()......