pandas列设置随机值(Pandas统计重复的列里面的值方法)
类别:脚本大全 浏览量:1668
时间:2022-04-02 02:10:17 pandas列设置随机值
Pandas统计重复的列里面的值方法pandas
代码如下:
|
import pandas as pd import numpy as np salaries = pd.DataFrame({ 'name' : [ 'BOSS' , 'Lilei' , 'Lilei' , 'Han' , 'BOSS' , 'BOSS' , 'Han' , 'BOSS' ], 'Year' : [ 2016 , 2016 , 2016 , 2016 , 2017 , 2017 , 2017 , 2017 ], 'Salary' : [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 ], 'Bonus' : [ 2 , 2 , 2 , 2 , 3 , 4 , 5 , 6 ] }) print (salaries) print (salaries[ 'Bonus' ].duplicated(keep = 'first' )) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'first' )].index) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'first' )]) print (salaries[ 'Bonus' ].duplicated(keep = 'last' )) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'last' )].index) print (salaries[salaries[ 'Bonus' ].duplicated(keep = 'last' )]) |
输出如下:
|
Bonus Salary Year name 0 2 1 2016 BOSS 1 2 2 2016 Lilei 2 2 3 2016 Lilei 3 2 4 2016 Han 4 3 5 2017 BOSS 5 4 6 2017 BOSS 6 5 7 2017 Han 7 6 8 2017 BOSS 0 False 1 True 2 True 3 True 4 False 5 False 6 False 7 False Name: Bonus, dtype: bool Int64Index([ 1 , 2 , 3 ], dtype = 'int64' ) Bonus Salary Year name 1 2 2 2016 Lilei 2 2 3 2016 Lilei 3 2 4 2016 Han 0 True 1 True 2 True 3 False 4 False 5 False 6 False 7 False Name: Bonus, dtype: bool Int64Index([ 0 , 1 , 2 ], dtype = 'int64' ) Bonus Salary Year name 0 2 1 2016 BOSS 1 2 2 2016 Lilei 2 2 3 2016 Lilei |
非pandas
对于如nunpy中的这些操作主要如下:
假设有数组
a = np.array([1, 2, 1, 3, 3, 3, 0])
想找出 [1 3]
则有
|
方法 1 m = np.zeros_like(a, dtype = bool ) m[np.unique(a, return_index = True )[ 1 ]] = True a[~m] |
|
方法 2 a[~np.in1d(np.arange( len (a)), np.unique(a, return_index = True )[ 1 ], assume_unique = True )] |
|
方法 3 np.setxor1d(a, np.unique(a), assume_unique = True ) |
|
方法 4 u, i = np.unique(a, return_inverse = True ) u[np.bincount(i) > 1 ] |
|
方法 5 s = np.sort(a, axis = None ) s[: - 1 ][s[ 1 :] = = s[: - 1 ]] |
参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array
以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持开心学习网。
原文链接:https://blog.csdn.net/hguo11/article/details/82556171
您可能感兴趣
- dedecms分页效果(织梦dedecms将列表页重复的第一页去除的方法)
- php怎么弄不重复字符串(PHP中将一个字符串部分字符用星号*替代隐藏的实现代码)
- 怎样用sql删除表里的重复数据(sql 删除表中的重复记录)
- sql如何把重复数据记录删除(sql分组后二次汇总处理表重复记录查询和删除的实现方法)
- Sql如何删除重复记录
- .net中生成不重复的随机数
- mysql把重复数据删掉(mysql查找删除重复数据并只保留一条实例详解)
- sql语句groupby分组后怎么显示(SQL group by去重复且按照其他字段排序的操作)
- css中分割线的渐变效果(CSS学习笔记之可重复渐变repeating-linear-gradient)
- 如何防止表单重复提交
- axios自动重复提交请求(Axios取消重复请求的方法实例详解)
- dataframe模糊匹配合并数据(对DataFrame数据中的重复行,利用groupby累加合并的方法详解)
- pandas如何删除索引列(pandas DataFrame 删除重复的行的实现方法)
- pandas列设置随机值(Pandas统计重复的列里面的值方法)
- python字符串找一个最大字符(Python查找最长不包含重复字符的子字符串算法示例)
- sql语句去除重复记录(使用SQL语句去掉重复的记录两种方法)
- 刘智泰确认出演《Good Wife》 担纲男一号(刘智泰确认出演Good)
- 《傲骨之战》剧终 律政女魔头Diane,为什么是大女主天花板(傲骨之战剧终律政女魔头Diane)
- 汉族(汉族的祖先是谁)
- 中国有几个名族(中国有几个民族没列入56个民族)
- 数学语文题目(语文的数学题)
- 香蕉(香蕉三种人不宜吃)
热门推荐
- phpstudy默认不支持64位php的解决方法(phpstudy默认不支持64位php的解决方法)
- python中读取文件怎么操作(Python实现的读取文件内容并写入其他文件操作示例)
- app怎样像web一样调试(详解webapp页面滚动卡顿的解决办法)
- apache配置详解(apache2.2和php5.2.17在windows下整合过程的错误解决方法)
- vue怎么实现预览与放大(Vue实现牌面翻转效果)
- html5播放代码(html5 video全屏播放/自动播放的实现示例)
- 浅析vps和云服务器的区别(浅析vps和云服务器的区别)
- pythonfor循环嵌套if语句(Python基础教程之if判断,while循环,循环嵌套)
- 宝塔面板怎么修改默认端口(如何修改宝塔Linux面板默认的端口号8888?)
- 免费ftp服务器怎么用(几种流行的ftp服务器软件推荐)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9