时间片线程切换指令周期流水线 TPS的初步了解

情况说明

Redis 单线程提供服务, 可以支撑十万级别的TPS
通过以个非常简单的测试
redis-benchmark -c 50 -n 50000 ping 
Intel 8369HB 3.3Ghz    14万TPS
阿里 倚天710  2.7Ghz    16万TPS
AMD 9T34     3.4Ghz    22万TPS 

可以推测, Redis执行一次ping到客户端, 在本地的情况下大概耗时
1S/20万 约等于 5微秒

认为: redis可以在 5 微秒之内 完成 客户端连接-命令执行-推送结果到客户端
如果是在不同机器上面, 那么时间差异可能会比较大一些. 因为有网络层的延迟与交互. 

想基于这个数据, 进行一些简单的分析与判断.

CPU与操作系统时间片

在多核CPU之前,PC以及一些简单的服务器一般只有一颗CPU
这种情况下. 实现多用户,多任务的处理都是通过时间片的概念来进行. 

CPU将自己的处理时间分为一定大小的时间片,给不同的任务进行处理. 
任务之间如果时间片到了需要让出时间片, 交由其他任务进行. 

linux的发行版的时间片是20ms到800ms不等. 
时间片的让出有 主动让出, 也有被动让出.
不管哪种让出都需要考虑 线程切换, 上下文切换. 

线程切换, 进程切换, 系统调用, 中断 都会导致上线文切换.

上下文切换 需要CPU 保存当前在运行进程的TLB,以及寄存器, 指令位置等信息
等待当前任务有了时间片时在加载进内存. 

需要说明一点: 
线程切换的成本比较高. 可能需要 1000-2000个质量周期, 耗时可能有1微秒甚至更多. 

回到刚才的例子, redis 在执行时面对不同的client 可能需要进行一次上下文切换,用于返回给特定的client信息.
一进一出, 损耗可能就有 2微秒, 加上一些协议开销. 理论上 redis执行一条指令 核心进程只需要 1微秒左右. 

理论上redis可以拿到百万级别的 TPS. 但是因为各种开销, 导致可能无法达到这个上限.

指令周期和流水线

CPU执行一条指令的时间, 可以大概的认为是指令周期.
一般2Ghz的CPU  他执行一条uop的时间可以简单理解为是 0.5纳秒.

但是需要注意的一点是: 虽然现在x86号称是CISC, 但是在x86CPU的指令解析和发射的部分其实是使用的RISC的技术.
他将复杂指令解析成一个一个微笑的 uop 才进入流水线进行调度. 

虽然将macro的op拆解成了一个一个minor op, 看起来会导致指令使用的周期变多. 
但是因为流水线和多发射超标量的存在, 一个周期可以发射6-8个指名. 并且多级流水线的存在同时运行的命令要更加多
会带来更多的性能收益. 

流水线里面将复杂的命令拆解到不通的周期中去执行. 
在遇到流水线毛线,或者是指令等待或者是冲突时, CPU会设计多种方式进行避免和提速. 

国产信创CPU可以做到多核心高频率, 但是很难在流水线和指令集并行部分达到Intel和AMD的水平, 
所以看机器的性能不能全看主频和核数, 还要看很细节的 指令流水和多发射相关信息. 

看量化分析性能的书时, 最近这些年性能的提升很多在用乱序指令集的一些优化.
Intel有几百个OOB的缓存, 可以都执行指令后统一进行排序返回和回写, 尽可能的提升性能.

TPS

TPS = 工作线程数/响应时间
所以提高TPS的方法就是 提高工作线程数和降低响应时间.

但是提供了工作线程, 会导致上下文切换增多好耗费更多的寄存器和内存来保存线程的状态. 超过一定限度, 线程切换的成本会极具上升. 

响应时间的提高不仅可以提升客户感受还能够尽快的完成任务. 
现在我们发现, 国产设备不够优秀的地方就在于响应时间. 
他的核心数足够多, 可以实现很多线程进行工作, 但是每个线程的相应时间却比较大, 到执客户反映不好用. 

虽然很多国产CPU的主频和核心数较多, 但是他们的指令集, 流水线, 乱序,以及架构等部分不如国际厂商先进.

所以很多时候不能单纯看核心和主频,还要看厂商和型号.

标签：指令,线程,切换,流水线,TPS,CPU
From： https://www.cnblogs.com/jinanxiaolaohu/p/17314586.html

java -- 线程
线程与进程进程：是指一个内存中运行的应用程序，每个进程都有一个独立的内存空间，一个应用程序可以同时运行多个进程；进程也是程序的一次执行过程，是系统运行程序的基本单位；系统运行一个程序即是一个进程从创建、运行到消亡的过程。线程：是进程中的一个执行单元，负责当前进程中程序的执......
C#多线程学习(一) 多线程的相关概念
C#多线程学习(一)多线程的相关概念什么是进程？当一个程序开始运行时，它就是一个进程，进程包括运行中的程序和程序所使用到的内存和系统资源。而一个进程又是由多个线程所组成的。什么是线程？线程是程序中的一个执行流，每个线程都有自己的专有寄存器(栈指针、程序计数器等)，但代码......
查看linux进程/线程跑在哪个cpu核上
方法一：使用top-Hppid然后按f，选择p,然后esc就行了方法二： psH-opid,lwp,psr,comm -p11115psr对应系统cpu线程号......
04_HTTPS实验
04_HTTPS实验《信息安全综合实践》实验报告HTTPS实验姓名：学号：邮箱：实验时长：分钟一、实验目的理解计算机网络基本概念；了解密码技术在网络安全中的应用；学习和掌握web服务搭建基本流程；学习和掌握https服务搭建基本流程。二、实......
HttpServeletRequest与RequestContextHolder.getRequestAttributes.getRequest的区别
HttpServletRequest是JavaServletAPI中的一个接口，它提供了访问HTTP请求的方法，例如获取请求参数、请求头、请求体等。它是在Servlet容器中处理HTTP请求时创建的，并在Servlet的doGet()、doPost()等方法中作为参数传递。RequestContextHolder.getRequestAttributes().getRequest......
RestSharp组件中止线程问题
背景：下单流程里面，生成发货单是在独立线程池完成的，有些批发订单数据巨大，频繁拆包生成多个发货单排查：由于ES刷新是在一个独立的api里面，一开始怀疑是异步线程频繁请求api导致中断的SemaphoreSlim：对同时访问资源或资源池的线程数加以限制，结果：无效lock：顺序执行，使线程等待，结......
Python爬虫之多线程加快爬取速度
之前我们学习了动态翻页我们实现了网页的动态的分页，此时我们可以爬取所有的公开信息了，经过几十个小时的不懈努力，一共获取了16万+条数据，但是软件的效率实在是有点低了，看了下获取10万条数据的时间超过了56个小时，平均每分钟才获取30条数据。注：软件运行的环境的虚拟主机，CPU:......
Python终止线程的方法
亲测使用如下方法有效，但是如果线程中涉及获取释放锁，可能会导致死锁。def_async_raise(tid,exctype):"""线程退出，这种方法是强制杀死线程，但是如果线程中涉及获取释放锁，可能会导致死锁。:paramtid:threadid:paramexctype:https://docs.python.org/zh-c......
spring事务里面开启线程插入，报错了是否会回滚?
1.前言一道非常有意思的面试题目。大概是这样子的，如果在一个事务中，开启线程进行插入更新等操作，如果报错了，事务是否会进行回滚2.代码示例1@RequestMapping("/test/publish/submit")publicStringtestPublish1(){ log.info("start..."); transactionTemplate.execute(new......
多线程应用案例
需求解析一个Excel中多个sheet的数据，那么此时就可以考虑使用多线程，每个线程解析一个sheet中的数据，然后等待所有的sheet数据解析完成后，再把数据入库在这个需求中，要实现主线程等待所有现场完成shee数据解析操作，第一种方案：采用join()方法publicclassMyJoinTest{publicstaticvoid......

时间片线程切换指令周期流水线 TPS的初步了解

时间片线程切换指令周期流水线 TPS的初步了解

情况说明

CPU与操作系统时间片

指令周期和流水线

TPS

相关文章

赞助商

阅读排行

时间片 线程切换 指令周期 流水线 TPS的初步了解

时间片 线程切换 指令周期 流水线 TPS的初步了解

情况说明

CPU与操作系统时间片

指令周期和流水线

TPS

相关文章

赞助商

阅读排行

时间片线程切换指令周期流水线 TPS的初步了解

时间片线程切换指令周期流水线 TPS的初步了解