«

»

查找统计Python列表中的重复元素

python 列表 字典有一个xml配置文件,里面配置了许多关键词,由于许多人维护这个配置文件,导致关键词有可能重复,引发一些问题。现在用正则将所有关键词提取到一个pyhton的list 里面,那么如何快速的统计出那些是重复的呢?形如aa=[1,2,2,3,2,4]的一个list,其中有重复元素,由于集合中重复元素无意义,所以bb=list(set(aa))可很容易得到去除重复的列表[1,2,3,4]。若比较aa和bb的长度,很容易发现有重复,但无法指出重复的元素是哪些。

那么用网上一个比较两个list差集的方法可行吗?

结果是不行,因为bb和aa的差正好都是重复的元素,而set(aa)的转换已经去除了重复元素,所以得到aa和bb的差值是[]。可见这种方法只能用于比较两个列表中有不同元素的情况。最简单的方法其实是引入Counter包:

然后Counter(aa),即可得到一个显示出所有元素重复次数的dict:Counter({2: 3, 1: 1, 3: 1, 4: 1})

出现频度最高的元素会默认在前面,也可用dict()操作符将其转换为一个普通的dict来进行额外处理。比如采用列表解析表达式来处理:

将显示出仅含重复项的列表:[‘2:3′]

1 星2 星3 星4 星5 星 (尚无评分)
Loading...Loading...

相关文章

Python中字典键值的大小写无关查找的方法 通常,忽略字典中键的大小写不是个好主意,因为dict类型的键是大小写敏感的,若忽略则可能造成两键的重...
Python的引用造成的特殊问题 Python中有一些不同于传统语言的特点。比如对象赋值,肯定传递的是对象。比如以下例子:a= 然后b...
Python的引用和深层拷贝 引用是Python语言动态性的基础之一,但引用也带来了一些副作用。Python中的对象均以引用方式访问,比如...
Python中的字典 Python的字典类型不是序列,而是一种映射,所以没有可靠的从左到右的次序。字典是Python核心对象中唯一...
Python中的列表 Python中的列表功能强大,远非其它语言中的数组可比。不同于整数或字符串,列表是一个真正可变的类型,...
Python获取当前版本的函数 Python2.x和3.x的区别之大,几乎可以作为一个变种语言存在。在实际开发中,Python的版本选择是很让人纠...
获取虚拟空间的系统版本和Python版本 vps虽好,但配置相对较低,成本相对较高。对于一个无限流量,无限空间的虚拟主机,其实可以更充分的利用...
php和python求阶乘 Python和php比较,php更象一种专用Web开发语言。而Python的应用面更广泛一些,更偏向于一种通用语言。虽...

发表评论

电子邮件地址不会被公开。