查找统计Python列表中的重复元素

苏葳 • 2014年4月18日 10:12 • 编程 • 阅读 193

有一个xml配置文件，里面配置了许多关键词，由于许多人维护这个配置文件，导致关键词有可能重复，引发一些问题。现在用正则将所有关键词提取到一个pyhton的list 里面，那么如何快速的统计出那些是重复的呢？形如aa=[1,2,2,3,2,4]的一个list，其中有重复元素，由于集合中重复元素无意义，所以bb=list(set(aa))可很容易得到去除重复的列表[1,2,3,4]。若比较aa和bb的长度，很容易发现有重复，但无法指出重复的元素是哪些。

那么用网上一个比较两个list差集的方法可行吗？

print list(set(aa).difference(set(bb)))

结果是不行，因为bb和aa的差正好都是重复的元素，而set(aa)的转换已经去除了重复元素，所以得到aa和bb的差值是[]。可见这种方法只能用于比较两个列表中有不同元素的情况。最简单的方法其实是引入Counter包：

   from collections import Counter

然后Counter(aa)，即可得到一个显示出所有元素重复次数的dict：Counter({2: 3, 1: 1, 3: 1, 4: 1})

出现频度最高的元素会默认在前面，也可用dict()操作符将其转换为一个普通的dict来进行额外处理。比如采用列表解析表达式来处理：

print [ str(k)+':'+str(v) for k,v in dict(Counter({2: 3, 1: 1, 3: 1, 4: 1})).items() if v>1]

将显示出仅含重复项的列表：[‘2:3’]

原创文章，作者：苏葳，如需转载，请注明出处：https://www.swmemo.com/549.html

dict list Python

赞 (0)

0

用Python的正则去除xml文件中的注释

« 上一篇 2014年4月18日 09:47

AIX5.2下编译安装Python2.5.6

下一篇 » 2014年4月18日 17:05

Stackless Python简介

官网介绍，Stackless Python是Python编程语言的一个增强版本，它使程序员从基于线程的编程方式中获得好处，并避免传统线程所带来的性能与复杂度问题。Stackless…

名词解释 2013年6月14日 0 0 0
AIX5.2下编译安装Python2.5.6

操作系统是aix 5.2。开始先下载了python-2.7.6.tgz，用gzip及tar解压缩后，进入Python-2.7.6目录：执行./configure，最后报错误： F…

操作系统 2014年4月18日 0 0 0
Boa Constructor在Windows7下控件消失的问题

安装Boa Constructor 0.6.1，wxPython版本是2.8.11.0，Python版本是2.7，此配置在windows xp下运行正常。今天将其安装至Window…

开发工具 2010年10月6日 0 0 0
Python中的列表

Python中的列表功能强大，远非其它语言中的数组可比。不同于整数或字符串，列表是一个真正可变的类型，列表是序列的一种，所以可做类似于字符串一样的序列操作。如len(list)，当…

编程 2012年10月27日 0 0 0
Python的三元条件表达式与列表解析表达式

Python作为一种非典型语言，天生就带有一些高级数据结构，如列表、元组、字典、集合、队列等，无需进一步编程就可以使用这些数据类型的操作。这些数据类型使得实现抽象的数学概念非常简单…

编程 2014年4月22日 0 0 0
Python令人头大的编码问题

从Java到C# 每次学新语言时，在数据库或是文件操作时都会遇到头疼的字符编码转换问题，悲剧的Python也一样。洋人是有多幸福，英文的代码语句，英文的文档，不用知道什么是输入法，…

编程 2010年10月24日 0 0 0
Python发送http请求

httplib是Python中http协议的客户端实现，是一个相对底层的http请求模块，其上有专门的包装模块，如urllib内建模块，goto等第三方模块，但是封装的层次越高，损…

编程 2013年6月17日 0 0 0
Python中的一些语言概念

Python语言可能被简单的划分至“脚本语言”类别，因为它跟大多数脚本语言一样可以解释执行。但实际上一些大规模软件开发计划例如Zope、Mnet及BitTorrent，Google…

编程 2012年10月29日 0 0 0
php和python求阶乘

Python和php比较，php更象一种专用Web开发语言。而Python的应用面更广泛一些，更偏向于一种通用语言。虽然从外表上看起来Python比php更象是脚本语言，拥有逐条解…

编程 2014年4月29日 0 0 0
Python文档中关于引用计数的一段翻译

在C或C++之类的语言中，程序员需负责在堆上动态分配和回收内存。在C中，通过使用malloc()和free()函数完成，在C++中，操作符new和delete以本质相同的方式运行，…

编程 2012年10月20日 0 0 0

发表评论取消回复