pandas列设置随机值(Pandas统计重复的列里面的值方法)
类别:脚本大全 浏览量:1668
时间:2022-04-02 02:10:17 pandas列设置随机值
Pandas统计重复的列里面的值方法pandas
代码如下:
|
import pandas as pd import numpy as np salaries = pd.DataFrame({ 'name' : [ 'BOSS' , 'Lilei' , 'Lilei' , 'Han' , 'BOSS' , 'BOSS' , 'Han' , 'BOSS' ], 'Year' : [ 2016 , 2016 , 2016 , 2016 , 2017 , 2017 , 2017 , 2017 ], 'Salary' : [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 ], 'Bonus' : [ 2 , 2 , 2 , 2 , 3 , 4 , 5 , 6 ] }) print (salaries) print (salaries[ 'Bonus' ].duplicated(keep = 'first' )) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'first' )].index) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'first' )]) print (salaries[ 'Bonus' ].duplicated(keep = 'last' )) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'last' )].index) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'last' )]) |
输出如下:
|
Bonus Salary Year name 0 2 1 2016 BOSS 1 2 2 2016 Lilei 2 2 3 2016 Lilei 3 2 4 2016 Han 4 3 5 2017 BOSS 5 4 6 2017 BOSS 6 5 7 2017 Han 7 6 8 2017 BOSS 0 False 1 True 2 True 3 True 4 False 5 False 6 False 7 False Name: Bonus, dtype: bool Int64Index([ 1 , 2 , 3 ], dtype = 'int64' ) Bonus Salary Year name 1 2 2 2016 Lilei 2 2 3 2016 Lilei 3 2 4 2016 Han 0 True 1 True 2 True 3 False 4 False 5 False 6 False 7 False Name: Bonus, dtype: bool Int64Index([ 0 , 1 , 2 ], dtype = 'int64' ) Bonus Salary Year name 0 2 1 2016 BOSS 1 2 2 2016 Lilei 2 2 3 2016 Lilei |
非pandas
对于如nunpy中的这些操作主要如下:
假设有数组
a = np.array([1, 2, 1, 3, 3, 3, 0])
想找出 [1 3]
则有
|
方法 1 m = np.zeros_like(a, dtype = bool ) m[np.unique(a, return_index = True )[ 1 ]] = True a[~m] |
|
方法 2 a[~np.in1d(np.arange( len (a)), np.unique(a, return_index = True )[ 1 ], assume_unique = True )] |
|
方法 3 np.setxor1d(a, np.unique(a), assume_unique = True ) |
|
方法 4 u, i = np.unique(a, return_inverse = True ) u[np.bincount(i) > 1 ] |
|
方法 5 s = np.sort(a, axis = None ) s[: - 1 ][s[ 1 :] = = s[: - 1 ]] |
参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array
以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持开心学习网。
原文链接:https://blog.csdn.net/hguo11/article/details/82556171
您可能感兴趣
- js数组去重复
- 深入理解mysql索引(MySQL中冗余和重复索引的区别说明)
- Sql如何删除重复记录
- python删除列表中的重复元素(Python实现去除列表中重复元素的方法总结7种方法)
- python数据分析删除重复值(Python3实现从排序数组中删除重复项算法分析)
- python中随机生成不重复随机数(python 在指定范围内随机生成不重复的n个数实例)
- python找到连续不重复最长英文串(Python实现简单查找最长子串功能示例)
- axios自动重复提交请求(Axios取消重复请求的方法实例详解)
- mysql查询数据去除重复(MySQL 大批量插入,如何过滤掉重复数据?)
- mysql数据库如何删除重复记录(mysql数据库删除重复数据只保留一条方法实例)
- 列表重复数据怎么删除python(Python实现的删除重复文件或图片功能示例去重)
- css中background image重复平铺(解决CSS 中box-sizing与background-clip解决背景显示范围的问题)
- python删除list的指定元素(Python list列表中删除多个重复元素操作示例)
- pandas如何删除索引列(pandas DataFrame 删除重复的行的实现方法)
- 怎样用sql删除表里的重复数据(sql 删除表中的重复记录)
- dataframe模糊匹配合并数据(对DataFrame数据中的重复行,利用groupby累加合并的方法详解)
- 素人恋爱综艺火药味十足 男生为赢得芳心集体扯头花,真是出好戏(素人恋爱综艺火药味十足)
- 《囧妈》为何受抵制 春节七部影片撤档背后的责任与博弈(囧妈为何受抵制)
- 提醒 2019年起河南驾考要开设科目五 官方回应来了(2019年起河南驾考要开设科目五)
- 省 市书法家协会 送万福进万家 活动走进禹州美丽乡村(省市书法家协会)
- 点赞 禹州苌庄正式撤乡建镇 未来发展不可估量(禹州苌庄正式撤乡建镇)
- 它荣获 中国生态魅力镇 称号 就在咱们禹州,一起来看看(中国生态魅力镇)
热门推荐
- mysql客户端怎么运行程序(MySQL 如何连接对应的客户端进程)
- laravel新增数据表(laravel实现上传图片的两种方式小结)
- mysql8.0.23.0官方安装手册(MySQL8.0.23安装超详细教程)
- sqlserver2008远程连接设置(如何开启SqlServer 远程访问)
- ubuntu20.2安装mysql(Ubuntu 14.04下mysql安装配置教程)
- css before和after(CSS中灵活使用:before和:after)
- python 微信二维码接口(python实现微信防撤回神器)
- centos7离线安装mysql5.7(CentOS7.5 安装MySql的教程)
- sqlserver复制表结构及数据到新表(SQL SERVER 表与表之间 字段一对多sql语句写法)
- truncate和delete(delete、truncate、drop的区别以及该如何选择)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9