首页 > 其他分享 >高通Perflock

高通Perflock

时间:2024-07-16 21:40:46浏览次数:18  
标签:sys perf int lock Perflock 高通 MPCTLV3 adb

高通的Perflock是Qualcomm公司开发的一项技术,用于优化设备性能和功耗管理。Perflock是一种锁定机制,允许操作系统或应用程序在需要时对处理器的性能状态进行控制,从而确保在关键任务或高性能需求的情况下,处理器能够维持在高性能状态。

主要功能和特点

  1. 性能锁定:Perflock允许应用程序或系统服务锁定CPU的频率或性能状态,以满足高性能需求。例如,在运行高性能游戏或进行繁重的计算任务时,可以使用Perflock确保CPU保持在高频率下运行。

  2. 功耗管理:在不需要高性能时,Perflock可以解除锁定,允许处理器降低频率,从而节省电量并降低功耗。

  3. 灵活性:开发者可以通过API接口使用Perflock,根据具体需求动态调整处理器的性能状态。

  4. 兼容性:Perflock主要应用于搭载Qualcomm处理器的设备,如智能手机和平板电脑。

应用场景

  • 游戏:在运行大型3D游戏时,使用Perflock可以确保游戏流畅运行,不会因为处理器降频而影响用户体验。
  • 多媒体处理:在视频编辑或其他多媒体处理应用中,Perflock可以提高处理速度和效率。
  • 系统任务:系统更新或备份等任务需要长时间高性能运行时,Perflock可以提供必要的性能支持。

如何使用高通perflock

image

Perflock的API封装在libqti-perfd-client.so库里面(源码在android/vendor/qcom/proprietary/commonsys-intf/android-perf/mp-ctl/client.cpp),主要包含三个方法:

  • int perf_lock_acq(int handle, int duration, int list[], int numArgs)
  • int perf_lock_rel(int handle)
  • int perf_hint(int hint, const char *pkg, int duration, int type)

Perflock的使用

可以通过perf_lock_acq和perf_lock_rel来提频操作。

handle参数

调用perf_lock_acq或perf_hint会返回一个handle,该Handle可以存起来后面继续使用。

第一次调用perf_lock_acq或perf_hint方法时,handle为0,perflock会创建一个新的handle

示例:

mHandle = (m_pPerfLockOps->perfLockAcquire(mHandle,
                                           timer,
                                           m_pPerflockInfo->perfLockParams,
                                           m_pPerflockInfo->perfLockParamsCount));

duration

表示要让Perf engine LOCK住多久,单位是ms。

如果设置为0,则表示无限时间。

list[] 和 numArgs

list[]是要传递给Perf Engine的参数,每2个参数为一组[resource, value],numArgs为参数个数。

list[] 和 numArgs示例:

{ // PERF_LOCK_OPEN_CAMERA
    perfLockParamsOpenCamera,
    sizeof(perfLockParamsOpenCamera) / sizeof(INT32)
},

perfLockParamsOpenCamera定义为:

static INT32 perfLockParamsOpenCamera[] =
{
    // Disable power collapse and set CPU clocks to turbo
    MPCTLV3_ALL_CPUS_PWR_CLPS_DIS,          0x1,
    MPCTLV3_SCHED_BOOST,                    0x1,
    MPCTLV3_MAX_FREQ_CLUSTER_BIG_CORE_0,    0xFFF,
    MPCTLV3_MIN_FREQ_CLUSTER_BIG_CORE_0,    0xFFF,
    MPCTLV3_MAX_FREQ_CLUSTER_LITTLE_CORE_0, 0xFFF,
    MPCTLV3_MIN_FREQ_CLUSTER_LITTLE_CORE_0, 0xFFF,
    MPCTLV3_MIN_FREQ_CLUSTER_PLUS_CORE_0,   0xFFF,
    MPCTLV3_MAX_FREQ_CLUSTER_PLUS_CORE_0,   0xFFF
};

可以看出来Open Camera时是

  • 关闭power collapse
  • 使能SCHED_BOOST
  • 大核、小核、超大核都切成turbo模式

perf_lock_rel

释放持有的perfLock,具体是哪个perflock由参数handle决定。

如果perf_lock_acq有设置duration,则不需要调用perf_lock_rel。

示例
在一个Native进程中使用PerfLock来调出两个核。

Makefile

LOCAL_SHARED_LIBRARIES := liblog libcutils libdl libqti-perfd-client
LOCAL_C_INCLUDES := device/qcom/common/power

源代码

#include <dlfcn.h>
#include “performance.h”
static void *qcopt_handle;
static int (*perf_lock_acq)(int handle, int duration, int list[], int numArgs);
static int (*perf_lock_rel)(int handle);
static int perf_lock_handle;
char opt_lib_path[PATH_MAX] = {0};
if (property_get("ro.vendor.extension_library", opt_lib_path, NULL) != 0) {
    if((qcopt_handle = dlopen(opt_lib_path, RTLD_NOW)) == NULL) {
        error_out();
    } else {
        perf_lock_acq = (int(*)(int, int, int*,int))dlsym(qcopt_handle, "perf_lock_acq");
        perf_lock_rel = (int(*)(int))dlsym(qcopt_handle, "perf_lock_rel");
    }
}
int perf_lock_opts[1] = {CPUS_ONLINE_MIN_2};
perf_lock_handle = perf_lock_acq(perf_lock_handle, 0, perf_lock_opts, 1);
// Critical section requiring PerfLock
perf_lock_rel(perf_lock_handle);

具体可参考代码:vendor/qcom/proprietary/android-perf/tests/ModuleTests/mp-ctl/perflock_native_test.cpp

PowerHint的使用

使用PowerHint需要先在powerhint.xml里面定义一个HintID,然后再调用perf_hint让其生效。

PowerHint XML位置: vendor/qcom/opensource/power/config/bengal/powerhint.xml,系统中,该文件存放在/vendor/etc/powerhint.xml"

其他XML文件位置定义如下:

#define PERF_MAPPING_XML "/vendor/etc/perf/perfmapping.xml"
#define PERF_BOOSTS_CONFIGS_XML "/vendor/etc/perf/perfboostsconfig.xml"
#define POWER_CONFIGS_XML "/vendor/etc/powerhint.xml"
#define COMMONRESOURCE_CONFIGS_XML "/vendor/etc/perf/commonresourceconfigs.xml"
#define TARGETRESOURCE_CONFIGS_XML "/vendor/etc/perf/targetresourceconfigs.xml"

语法:

int perf_hint(int hint, const char *pkg, int duration, int type)
  • hint- 识别每个Hit的ID。
  • Pkg- 谁触发这个Hint。
  • Duration- Duration of the hint perflock.
  • Type- To differentiate between similar action, like horizontal scroll/vertical scroll,一般可以传-1。

常用Resource ID

Resource ID Resource Name Description Description
0x40400000 MPCTLV3_TOGGLE_POWER_COLLAPSE 是否允许CPU进入深度低功耗模式 /dev/cpu_dma_latency,默认空,不允许则设置为1
0x40C00000 MPCTLV3_SCHED_BOOST 1 (Fullthrottle), 2(Conservative),3(Restrained) SCHED加速类型 /proc/sys/kernel/sched_boost
0x40800100 MPCTLV3_MIN_FREQ_CLUSTERLITTLE CORE_0 设置小核最小频率,十六进制 /sys/module/msm_performance/p arameters/cpu_min_freq
0x40804100 MPCTLV3_MAX_FREQ_CLUSTERLITTLE CORE_0 设置小核最大频率,十六进制 /sys/module/msm_performance/p arameters/cpu_max_freq
0x40800000 MPCTLV3_MIN_FREQ_CLUSTER_BIG_CO RE_0 设置大核最小频率,十六进制 /sys/module/msm_performance/p arameters/cpu_min_freq
0x40804000 MPCTLV3_MAX_FREQ_CLUSTER_BIG_CO RE_0 设置大核最大频率,十六进制 /sys/module/msm_performance/p arameters/cpu_max_freq
0X42804000 MPCTLV3_GPU_MIN_POWER_LEVEL 设置GPU最小PowerLevel,十六进制 /sys/class/kgsl/kgsl3d0/min_pwrlevel
0X42808000 MPCTLV3_GPU_MAX_POWER_LEVEL 设置GPU最大PowerLevel,十六进制 /sys/class/kgsl/kgsl3d0/max_pwrlevel
0x41000000 MPCTLV3_MIN_ONLINE_CPUCLUSTER 最小几个大核Online /sys/devices/system/cpu/cpu*/cor e_ctl/min_cpus
0x41004000 MPCTLV3_MIN_ONLINE_CPUCLUSTER BIG 最多几个大核Online /sys/devices/system/cpu/cpu*/cor e_ctl/max_cpus
0x41000100 MPCTLV3_MIN_ONLINE_CPUCLUSTER LITTLE 最小几个小核Online /sys/devices/system/cpu/cpu*/cor e_ctl/min_cpus
0x41004100 MPCTLV3_MAX_ONLINE_CPUCLUSTER LITTLE 最多几个小核Online /sys/devices/system/cpu/cpu*/cor e_ctl/max_cpus
0x41000200 MPCTLV3_MIN_ONLINE_CPUCLUSTER PRIME 最小几个超大核Online /sys/devices/system/cpu/cpu*/cor e_ctl/min_cpus
0x41800000 MPCTLV3_CPUBW_HWMON_MIN_FREQ CPU请求的最小DDR频率 /sys/class/devfreq/soc:qcom,cpub w/min_freq
0x41818000 MPCTLV3_CPUBW_HWMON_MAX_FREQ CPU请求的最大DDR频率 /sys/class/devfreq/soc:qcom,cpub w/max_freq

OpenCamera过程中,将所有CPU都拉满

static INT32 perfLockParamsOpenCamera[] =
{
    // Disable power collapse and set CPU clocks to turbo
    MPCTLV3_ALL_CPUS_PWR_CLPS_DIS,          0x1,
    MPCTLV3_SCHED_BOOST,                    0x1,
    MPCTLV3_MAX_FREQ_CLUSTER_BIG_CORE_0,    0xFFF,
    MPCTLV3_MIN_FREQ_CLUSTER_BIG_CORE_0,    0xFFF,
    MPCTLV3_MAX_FREQ_CLUSTER_LITTLE_CORE_0, 0xFFF,
    MPCTLV3_MIN_FREQ_CLUSTER_LITTLE_CORE_0, 0xFFF,
    MPCTLV3_MIN_FREQ_CLUSTER_PLUS_CORE_0,   0xFFF,
    MPCTLV3_MAX_FREQ_CLUSTER_PLUS_CORE_0,   0xFFF
};

PerfLock in Camera

CamX

CamX中有一个类:CamxPerfLockManager,封装了对perflock的使用,代码路径为:vendor/qcom/proprietary/camx/src/osutils/camxperf.cpp

CHI

CHI也有一个类:PerfLockManager,封装了对perflock的使用,代码路径为:vendor/qcom/proprietary/chi-cdk/core/chiutils/chxperf.cpp

Perflock 调试

Log

adb root 
adb remount(disable verity if needed) 
adb shell "echo vendor.debug.trace.perf=1 >> /system/build.prop" 
adb reboot

然后从Log里面能看到如下打印:

07-10 16:07:27.575 13212 13212 E ANDR-PERF-MPCTL: perf_lock_acq: client_pid=1007, client_tid=1095, inupt handle=0, duration=80 ms, 
num_args=18, list=0x43000000 0x19 0x40800000 0x3E8 0x40800100 0x3E8 0x40800200 0x3E8 0x40C00000 0x2 0x43400000 0x1F40 0x40C74000 0xFF
0x40408000 0x63 0x41000000 0x3 
07-10 16:07:27.575 13212 13212 E ANDR-PERF-MPCTL: perf_lock_acq: output handle=1
07-10 16:07:27.576 13212 13212 E ANDR-PERF-MPCTL: perf_lock_acq: client_pid=1007, client_tid=1095, inupt handle=0, duration=0 ms, num_args=18, 
list=0x43000000 0x11 0x40800000 0x3E8 0x40800100 0x3E8 0x40800200 0x3E8 0x40C00000 0x2 0x43400000 0x1F40 0x40C74000 0xFF 0x40408000 0x63 
0x41000000 0x3 
07-10 16:07:27.576 13212 13212 E ANDR-PERF-MPCTL: perf_lock_acq: output handle=2
07-10 16:07:27.649 13212 13213 E ANDR-PERF-MPCTL: perf_lock_rel: input handle=2
07-10 16:07:27.660 13212 13213 E ANDR-PERF-MPCTL: perf_lock_rel: input handle=1

如果需要更多Log,可以打开QC_DEBUG:

在vendor/qcom/proprietary/android-perf/mp-ctl/, 在makefile中打开 QC_DEBUG flag

Dump

可以执行

dumpsys vendor.perfservice

来dump 处于active状态的 request list。

实验验证CPU/GPU/DDR最高频

关闭perflock和thermal

adb shell su -c setenforce 0
adb shell stop thermal-engine
adb shell stop perf-hal-1-0
adb shell stop perfd

perf-hal的版本要注意不一定是1.0,具体的perf hal版本可以参考:vendor/qcom/proprietary/android-perf/perf-hal/xxxx.rc

关闭 low power model

adb shell "echo Y > /sys/module/lpm_levels/parameters/sleep_disabled“

online 所有 cpus

adb shell "echo 4 > /sys/devices/system/cpu/cpu0/core_ctl/min_cpus“
adb shell "echo 4 > /sys/devices/system/cpu/cpu0/core_ctl/max_cpus“
adb shell "echo 4 > /sys/devices/system/cpu/cpu4/core_ctl/min_cpus"
adb shell "echo 4 > /sys/devices/system/cpu/cpu4/core_ctl/max_cpus"
adb shell "echo 1 > /sys/devices/system/cpu/cpu0/online"
adb shell "echo 1 > /sys/devices/system/cpu/cpu1/online"
adb shell "echo 1 > /sys/devices/system/cpu/cpu2/online"
adb shell "echo 1 > /sys/devices/system/cpu/cpu3/online"
adb shell "echo 1 > /sys/devices/system/cpu/cpu4/online"
adb shell "echo 1 > /sys/devices/system/cpu/cpu5/online"
adb shell "echo 1 > /sys/devices/system/cpu/cpu6/online"
adb shell "echo 1 > /sys/devices/system/cpu/cpu7/online"

cpufreq performance

adb shell "echo performance > /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor"

gpu performance

adb shell stop mpdecision
adb shell "echo 0 > /sys/class/kgsl/kgsl-3d0/min_pwrlevel"
adb shell "echo 0 > /sys/class/kgsl/kgsl-3d0/max_pwrlevel"
adb shell "echo 1 > /sys/class/kgsl/kgsl-3d0/force_rail_on"
adb shell "echo 1 > /sys/class/kgsl/kgsl-3d0/force_clk_on"
adb shell "echo 1 > /sys/class/kgsl/kgsl-3d0/force_bus_on"
adb shell "echo 10000000 > /sys/class/kgsl/kgsl-3d0/idle_timer"
adb shell "echo performance > /sys/class/kgsl/kgsl-3d0/devfreq/governor"

ddr performance

adb shell "echo performance >/sys/class/devfreq/*/governor”

总结

Perflock通过在需要时锁定和控制处理器的性能状态,帮助设备在高性能和低功耗之间找到平衡,提升用户体验和设备效率。这项技术对于需要高性能的应用尤其重要,但也需要谨慎使用,以避免不必要的功耗增加。

标签:sys,perf,int,lock,Perflock,高通,MPCTLV3,adb
From: https://www.cnblogs.com/linhaostudy/p/18306180

相关文章

  • 高通dump ftrace & kernelshark使用
    简介高通ramdump可以解析出ftrace,方便用于追踪快省稳问题。kernelshark是一个可以查看traceevent的图形化工具,方便梳理和观察内核微观行为。trace-cmd是设置读取ftrace的命令行工具,kernelshark既可以记录数据,也可以图形化分析结果。在/sys/kernel/debug/tracing/......
  • 高通SNPE for Windows入门
    高通SNPE运行在Windows11forx64上的基础教程,相关软件自行下载,注意版本差异。1.平台Windows11onx64PowershellVisualStudio2022Python3.10QualcommNeuralProcessingSDK2.环境变量创建一个Python3环境:$py-3.10-mvenv"<PYTHON3.10_VENV_ROOT>"$&"<......
  • 高通量表型组平台及系统列表
    全球主要可用的高通量表型分析设施列表参考1参考2来源:赵春江,植物表型组学大数据及其研究进展参考3来源:High-ThroughputPhenotyping:APlatformtoAccelerateCropImprovement......
  • 高通SA8295P芯片技术规格详解与原理解析
    高通SA8295P芯片技术规格详解与原理解析高通SA8295P(骁龙8295)是一款专为汽车座舱设计的高性能SoC(系统级芯片),采用最新的5nm工艺,具备强大的计算能力、图形处理能力以及丰富的外设支持。以下是该芯片的详细技术规格和工作原理解析。1.处理器核心(CPU)Snapdragon™SA8295PS......
  • Windows系统如何实现对高通ARM处理器的支持探讨
    近年来,随着移动设备和低功耗计算的兴起,ARM架构的处理器越来越受到关注。微软作为操作系统领域的巨头,推出了Windows系统对高通公司开发的ARM架构处理器的支持,这无疑引起了广泛的兴趣与讨论。那么,微软是如何实现对ARM处理器的支持的呢?是否采用了原生支持?是否由于增加了抽象层......
  • Android高通 12/13 录屏流程代码位置
     需求如下图实现系统录屏功能 frameworks/base/packages/SystemUI/src/com/android/systemui/screenrecord涉及代码ScreenRecordDialog#startBtnRecordingService#start#end ScreenMediaRecorder.java1、点击开始录屏frameworks/base/packages/SystemUI/src/......
  • 高通在推动混合 AI 规模化 扩展方面独具优势
    高通在推动混合AI规模化扩展方面独具优势摘要正如白皮书第一部分所言,在云端和终端进行分布式处理的混合AI才是AI的未来。混合AI架构,或仅在终端侧运行AI,能够在全球范围带来成本、能耗、性能、隐私、安全和个性化优势。高通正在助力实现随时随地的智能计算。高通技术......
  • 高通将支持 Meta Llama 3 在骁龙终端运行;特斯拉中国全系车型降价 1.4 万元丨 RTE 开发
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点......
  • 高通平台 按键 进入 fastboot/recovery/edl 模式
    在大多数高通平台上,默认都提供以下的按键功能:按住 vol+ 键开机,进入recovery模式。按住 vol- 键开机,进入fastboot模式。按住 vol+ 键及 vol- 键开机,进入edl(EmergencyDownload)模式。 高通方案的Android设备主要有以下几种开机模式,Android、EDL、Fastboot、Re......
  • 高通芯片平台进9008端口
    https://blog.csdn.net/u013795543/article/details/119640205 1、通过下面adb 命令进入adbrebootedl 2、上面adb命令进入9008失败的话,设备关机,通融过usb线连上电脑,同时按住音量上键、音量下键和电源键一会,即可进入9008模式附上进入9008成功的电脑端口截图: ......