6、Python如何统计序列中元素的频度

时间：2024-09-10 09:23:55浏览次数：12

标签：Python res Counter countRes print 频度序列 data 字典

有一个列表如下：

data = ['a', 'c', 'f', 'b', 'f', 'e', 'k', 'd', 'f', 'k']

如何统计每个元素出现的次数呢？

方案一：使用 List count方法

如果只要知道某一个元素出现的次数，直接使用 List count 方法就可以

data = ['a', 'c', 'f', 'b', 'f', 'e', 'k', 'd', 'f', 'k']
res = data.count('f')
print(res)
# 如果要统计所有的元素，也可以循环处理
res = dict()
for d in data:
    res[d] = data.count(d)
print(res)

方案二：列表循环，使用字典 dict 统计

更上面的循环一个意思，我们有多种方式处理，核心思想都是使用字典存储结果，对列表进行循环，往字典中赋值。下面几种写法给大家开拓一下思路。

countRes = dict()
for d in data:
    if d in countRes:
        countRes[d] += 1
    else:
        countRes[d] = 1
print(countRes)

当然，也可以使用字典的 fromkeys 函数，创建一个新字典

countRes = dict.fromkeys(data, 0)
for d in data:
    countRes[d] += 1
print(countRes)

当然，基本同样的思路，也可以使用 collections.defaultdict 统计。

defaultdict(parameter) 接受一个类型参数，例如：int、float、str 等。

传递进来的类型参数，不是用来约束值的类型，更不是约束键的类型，而是当键不存在时，实现一种值的初始化。

from collections import defaultdict
data = ['a', 'c', 'f', 'b', 'f', 'e', 'k', 'd', 'f', 'k']
countRes = defaultdict(int)
for d in data:
    countRes[d] += 1
print(countRes)

方案三：使用标准库 collections 模块中的 Counter 对象

Counter 是一个容器对象，使用 collections 模块中的 Counter 类可以实现 hash 对象的统计。

Counter 是一个无序的容器类型，以字典的键值对形式存储，其中元素作为 key，其计数作为 value。计数值可以是任意的 Interger（包括0和负数）。

Counter() 对象还有几个可调用的方法：

most_common(n) – TOP n 个出现频率最高的元素
elements – 获取所有的键通过list转化
update – 增加对象
subtrct – 删除对象
下标访问 a[‘xx’] --不存在时返回0

所以，我们可以直接把列表传给Counter获取频度结果，如下：

from collections import Counter
res = Counter(data)
print(res)

还有一个问题说明一下，如果需要找到频度最高或者最低的某几个元素，如何处理？

如果使用字典统计的方式，直接根据字典的值对字典中的项进行排序就可以了，具体可以参考我的这篇文章 Python根据字典中值的大小, 对字典中的项排序；如果使用的是 Counter 对象，也可以使用 most_common 函数获取出现频率最高的n个元素。

标签：Python,res,Counter,countRes,print,频度,序列,data,字典
From： https://blog.csdn.net/qq_40609533/article/details/142084946

【pytorch(cuda)】基于DQN算法的无人机三维城市空间航线规划（Python代码实现）
......
【负荷预测】【没发表过论文】基于VMD-CNN-BiLSTM-Attention的负荷预测研究（Python代码
......
Introduction to data Science with Python
FINALASSESEMENT.IntroductiontodataSciencewithPythonGeneralInstructionsThisisthefinalassessmentforthecourse.Youneedtodownloadthedatasetsprovidedtoanswerthequestions.The5datasetsnamed'World_Happiness_Report'(there......
python 实现gamma 伽玛功能算法
gamma伽玛功能算法介绍Gamma（伽玛）功能算法通常与不同的领域和应用相关，包括但不限于图像处理、光学测试、数学计算等。以下是根据您提供的搜索结果，对Gamma伽玛功能算法的一些概述：在图像处理中的Gamma校正在图像处理中，Gamma校正是一种用于调整图像亮度的方法，特别是为了校正......
python 实现gaussian高斯算法
gaussian高斯算法介绍高斯算法（Gaussianalgorithm）是一个广泛的概念，因为“高斯”这个名字与许多不同的数学和算法技术相关联。但是，在大多数情况下，当人们提到“高斯算法”时，他们可能是在指高斯消元法（Gaussianelimination），这是一种在数学中用于求解线性方程组、计算矩阵的行列......
中文关键字检索分析-导出到csv或者excel-多文件或文件夹-使用python和asyncio和pandas
1.02版本把原来的tab一个个拼接成文件输出，改成pandas的dataframe使用asyncio库来使用协程，但是测试下来速度好像是差不多的。可能速度太快了，没能很好的测出来差异。原来的最初的代码是java版本的，现在用python重写一遍java版本使用completableFuture来异步IO，主要是文件输......
python编译安装亲测
yumgroupinstall"DevelopmentTools"yuminstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-devellibffi-devellscd/opt/lsmkdirpythoncdpython/ ls wgethttps://www.python.org/ftp/python/3......
类实现序列化接口后自动生成序列化ID
1、为什么要实现序列化接口？在Java中，Serializable是一个标记接口（markerinterface），它本身并不包含任何方法。当一个类实现了Serializable接口，意味着这个类的对象可以被序列化，即可以转换为字节流，从而可以通过网络传输或者保存到磁盘上。为了保证序列化对象的唯一性以及版本控......
python的迭代器和生成器？
python中的迭代器和生成器都是用来处理数据序列的。迭代器迭代器是一个可以记住遍历位置的对象，使用iter()创建一个迭代器，使用next()方法依次返回迭代器中的每一个元素，如果数组里面的数据已经遍历完了，就会抛出StopIteration异常list=[2,9,34,56,78,3,6,8,3,67]创建迭代器：it=it......
2389. 和有限的最长子序列
题目链接2389.和有限的最长子序列思路贪心+排序+二分题解链接非暴力做法：前缀和+二分查找+原地O(1)空间（Python/Java/C++/Go）关键点1.贪心：由于元素和有上限，为了能让子序列尽量长，子序列中的元素值越小越好。2.本题要求计算元素和，因此元素在数组中的位置无......

6、Python如何统计序列中元素的频度

相关文章

赞助商

阅读排行