首页 > 其他分享 >OpenCL performance on intel i5-11400 by Clpeak

OpenCL performance on intel i5-11400 by Clpeak

时间:2025-01-21 10:26:48浏览次数:1  
标签:compute intel 11400 OpenCL precision bandwidth GIOPS Integer ptr

Platform: NVIDIA CUDA
Device: NVIDIA GeForce RTX 4090
Driver version  : 550.127.05 (Linux x64)
Compute units   : 128
Clock frequency : 2520 MHz

Global memory bandwidth (GBPS)
  float   : 873.20
  float2  : 901.24
  float4  : 917.89
  float8  : 928.70
  float16 : 938.94

Single-precision compute (GFLOPS)
  float   : 84761.26
  float2  : 80760.14
  float4  : 80512.55
  float8  : 79900.18
  float16 : 79513.42

No half precision support! Skipped

Double-precision compute (GFLOPS)
  double   : 1398.84
  double2  : 1397.85
  double4  : 1394.48
  double8  : 1387.83
  double16 : 1374.64

Integer compute (GIOPS)
  int   : 44124.49
  int2  : 44080.14
  int4  : 43970.14
  int8  : 44089.10
  int16 : 44104.19

Integer compute Fast 24bit (GIOPS)
  int   : 44067.89
  int2  : 44081.56
  int4  : 44038.71
  int8  : 43851.83
  int16 : 43369.82

Integer char (8bit) compute (GIOPS)
  char   : 38655.31
  char2  : 38334.73
  char4  : 37103.88
  char8  : 30839.88
  char16 : 28388.27

Integer short (16bit) compute (GIOPS)
  short   : 36869.31
  short2  : 35287.81
  short4  : 36894.71
  short8  : 32896.40
  short16 : 28145.07

Transfer bandwidth (GBPS)
  enqueueWriteBuffer              : 10.68
  enqueueReadBuffer               : 15.51
  enqueueWriteBuffer non-blocking : 10.08
  enqueueReadBuffer non-blocking  : 13.46
  enqueueMapBuffer(for read)      : 19.79
    memcpy from mapped ptr        : 11.54
  enqueueUnmap(after write)       : 25.13
    memcpy to mapped ptr          : 11.41

Kernel launch latency : 4.06 us

标签:compute,intel,11400,OpenCL,precision,bandwidth,GIOPS,Integer,ptr
From: https://www.cnblogs.com/happypony/p/18683068

相关文章

  • IntelliJ IDEA 2024.3 Java开发工具
    IntelliJIDEA2024.3Java开发工具JetBrainsIntelliJIDEA2024mac,是一款Java开发工具,IntelliJIDEA凭借无与伦比的Java和Kotlin支持脱颖而出。从一开始就支持尖IDEA2024.3中文版开发工具端语言功能,保持领先地位。IntelliJIDEA对您的代码了如指掌,利用这些知识在每个......
  • IntelliJ IDEA增加右键菜单
    提示:这是一篇主要讲述如何给IntelliJIDEA增加右键菜单的文章,文章目录问题描述解决方案1.打开注册表编辑器2.找到路径,HKEY_CLASSES_ROOT\Directory\shell3.增加右键菜单的IntelliJIDEA显示路径4.增加右键菜单IntelliJIDEA的执行路径5.测试问题描述安装完Intel......
  • IntelliJ IDEA 设置编码为utf-8编码
    IntelliJIDEA设置编码为utf-8编码IntelliJIDEA统一设置编码为utf-8编码问题一:File->Settings->Editor->FileEncodings​​问题二:File->OtherSettings->DefaultSettings->Editor->FileEncodings问题三:将项目中的.idea文件夹中的encodings.xml文件中的编码格式改......
  • IntelliJ idea 2023.2.2 下载及破解教程
    本方法适用于全系列版本。介绍IDEA和JetBrains系列所有软件(IntelliJIDEA、CLion、PhpStorm、GoLand、PyCharm、WebStorm、Rider、DataGrip、RubyMine、AppCode、DataSpell、Gateway、dotCover、dotTrace、dotTrace等等)的激活破解。JetBrains系列软件数量很多,你需要的话一个一个......
  • 人工智能(Artificial Intelligence)是什么?人工智能有什么好处?AI应用架构的关键组成?人工
    AI人工智能(ArtificialIntelligence)概念与历程了解人工智能向何处去,首先要知道人工智能从何处来。1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的......
  • OpenCL入门笔记
    1、概述1.1、OpenCL标准OpenCL(OpenComputingLanguage)是一个开放标准的并行编程框架,它允许开发者在异构系统上利用各种计算设备(例如CPU、GPU、FPGA等)来加速任务,目前已被广泛应用于视频处理、医学成像、机器学习等领域。OpenCL最初由苹果公司提出,并在与AMD、IBM、Intel、NVID......
  • 解决 IntelliJ IDEA 快捷键冲突问题
    解决IntelliJIDEA快捷键冲突问题在使用IntelliJIDEA进行开发时,快捷键是提高效率的重要工具。然而,某些外部软件(如GeForceExperience、网易云音乐等)可能会占用IDEA的快捷键,导致快捷键冲突。本文将总结如何解决快捷键冲突问题,并介绍一些实用的工具和方法。1.常见快捷键......
  • IntelliJ IDEA 调试技巧:从入门到精通
    IntelliJIDEA调试技巧:从入门到精通IntelliJIDEA是一款功能强大的集成开发环境(IDE),尤其在调试代码方面提供了丰富的工具和功能。无论是初学者还是经验丰富的开发者,掌握IDEA的调试技巧都能显著提高开发效率。本文将详细介绍IDEA的调试功能,并结合一些实用技巧,帮助你更好地理......
  • The Superalignment of Superhuman Intelligence with Large Language Models
    本文是LLM系列文章,针对《TheSuperalignmentofSuperhumanIntelligencewithLargeLanguageModels》的翻译。超人类智能与大型语言模型的超对齐摘要1引言2从学习角度定义超对齐3超对齐研究中的关键问题4实现超对齐的框架5结论和未来方向摘要由于大......
  • 欧洲位置传感器 (Sensor) + 以太联Intellinet PoE智能解决方案助力数字转型
    在快速变化的市场中,精准定位与高效网络管理成为各行各业提升竞争力的关键因素。无论是医疗中心还是物流仓储,透过欧洲sensor制造商与以太联—Intellinet网络解决方案的整合,企业能实现资产追踪自动化、提升运营效率,并降低碳排放。以太联-Intellinet的self-HealingNetwork技术与......