python中list中的元素去重

时间：2023-02-13 23:15:36浏览次数：67

标签：OrderedDict python reduce 元素 list ids itertools news

直观方法

最简单的思路就是：

代码如下:
ids = [1,2,3,3,4,2,3,4,5,6,1]
news_ids = []
for id in ids:
if id not in news_ids:
news_ids.append(id)

print news_ids

这样也可行，但是看起来不够爽。

用set

另外一个解决方案就是用set：

代码如下:
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids = list(set(ids))

这样的结果是没有保持原来的顺序。

按照索引再次排序

最后通过这种方式解决：

代码如下:
ids = [1,4,3,3,4,2,3,4,5,6,1]
news_ids = list(set(ids))
news_ids.sort(ids.index)

使用itertools.grouby

文章一开始就提到itertools.grouby, 如果不考虑列表顺序的话可用这个：

代码如下:
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids.sort()
it = itertools.groupby(ids)

for k, g in it:
print k

关于itertools.groupby的原理可以看这里：http://docs.python.org/2/library/itertools.html#itertools.groupby

网友补充：用reduce

网友reatlk留言给了另外的解决方案。我补充并解释到这里：

代码如下:
In [5]: ids = [1,4,3,3,4,2,3,4,5,6,1]

In [6]: func = lambda x,y:x if y in x else x + [y]

In [7]: reduce(func, [[], ] + ids)
Out[7]: [1, 4, 3, 2, 5, 6]

上面是我在ipython中运行的代码，其中的 lambda x,y:x if y in x else x + [y] 等价于 lambda x,y: y in x and x or x+[y] 。

思路其实就是先把ids变为[[], 1,4,3,......] ,然后在利用reduce的特性。reduce解释参看这里：http://docs.python.org/2/library/functions.html#reduce

另外还有一种方法：

使用 collections.OrderedDict.fromkeys()

这是完成特殊任务的最快方式。它首先删除列表中的重复项并返回一个字典，最后将其转换为列表。此方法也可用于字符串，之后列表中元素的顺序也发生了变化。

# Python 3 code to demonstrate 
# removing duplicated from list 
# using collections.OrderedDict.fromkeys()
from collections import OrderedDict
# initializing 
listtest_list = [1, 5, 3, 6, 3, 5, 6, 1]
print ("The original list is : " +  str(test_list))
# using collections.OrderedDict.fromkeys()
# to remove duplicated from list 
res = list(OrderedDict.fromkeys(test_list))
# printing list after removal print ("The list after removing duplicates : " + str(res))

标签：OrderedDict,python,reduce,元素,list,ids,itertools,news
From： https://www.cnblogs.com/chentiao/p/17118218.html

SparkSQL指南-快速开始（Python版）——（一）
快速开始创建环境Spark程序主要分为三个阶段：创建环境数据操作关闭环境（在Streaming程序中为执行环境）下面是批处理的SparkSQLAPI的创建环境的类：SparkSession,其目的......
算法随想Day11【栈与队列】| LC239-滑动窗口最大值、LC347-前 K 个高频元素
LC239.滑动窗口最大值思路分析：1、暴力出奇迹，对n个元素各遍历k次，记录最大值，复杂度O(n*k)2、如果存在一种数据结构，能模拟滑动串口，且能提供pop()、push()、getMaxValue(......
python中defaultdict 的用法
defaultdict：当我使用普通的字典时，用法一般是dict={},添加元素的只需要dict[element]=value即，调用的时候也是如此，dict[element]=xxx,但前提是element字典里，如果不在字......
电商网站Web自动化测试实战（编写京东搜索脚本python+selenium框架）
电商网站Web自动化测试实战（编写京东搜索脚本）1，打开京东页京东首页地址：https://www.jd.com/，故进入京东首页如下：2，打开浏览器开发者模式定位元素前需先打开浏览器开发者......
python pandas库总结-数据分析和操作工具
参考：https://pandas.pydata.org/Input/output相关函数pandas.read_excel—将Excel文件读入pandas数据框支持读取xls,xlsx,xlsm,xlsb,odf,ods和odt文件扩展名，支持单......
python爬虫学习——列表
namelist=[]#定义一个空的列表namelist1=["小张","小红","小李"]print(namelist1[0])print(namelist1[1])print(namelist1[2])testlist=[1,"测试"]#列表中......
python入门学习笔记004--趣学Python算法--第4例百钱百鸡
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱百鸡问题”：一只公鸡值五钱，一只母鸡值三钱，三只小鸡值一钱，现在要用百钱买百鸡，请问公鸡、母鸡、小鸡各多少只？ ......
python 多线程 join
当一个进程启动之后，会默认产生一个线程。这个线程就是主线程。如果是多线程时，主线程会创建多个线程。主线程执行完成后就会退出。多线程执行完成后也会退出。注意：只有守护......
python文件I/O
1、打印到控制台：printif__name__=='__main__':print('hello')2、读取键盘输入：inputif__name__=='__main__':str1=input('请输入:')print(str1)3、打开......
Python_json类方法
Python_json类方法importrequestsimportjsonheaders={"User-Agent":"Mozilla/5.0(LinuxAndroid6.0Nexus5Build/MRA58N)AppleWebKit/537.36(KHTML,l......

python中list中的元素去重

相关文章

赞助商

阅读排行