pandas数据分组后的处理(详解pandas如何去掉、过滤数据集中的某些值或者某些行?)
pandas数据分组后的处理
详解pandas如何去掉、过滤数据集中的某些值或者某些行?摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。
0.导入我们需要使用的包
import pandas as pd
pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。
1.去掉某些具体值
数据集df中,对于属性appplatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。
import pandas as pd
|
df[(true - df[ 'appplatform' ].isin([ 2 ]))] |
当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appid这个属性,我们想去掉appid=278和appid=382的样本。
|
df[(true - df[ 'appid' ].isin([ 278 , 382 ]))] |
另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appplatform=2而且appid=278和appid=382的样本呢?非常简单。
|
df[(true - df[ 'appid' ].isin([ 278 , 382 ]))&(true - df[ 'appplatform' ].isin([ 2 ]))] |
其实,在这里我们看到,就是由两部分组成的,第一部分就是appid中等于278和382的,另外一部分就是appplatform中等于2的。两者取逻辑关系 与(&)
2.过滤掉某个范围的值
上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeid(第一列)中id值大于10000的样本。
|
df[df[ 'creativeid' ]< = 10000 ] |
另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。
以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
原文链接:https://blog.csdn.net/qq_22238533/article/details/76127966
- python数据分析用到的模块(python模块之subprocess模块级方法的使用)
- sqlserver数据库的对象有哪些(详解SQL Server数据库架构和对象、定义数据完整性)
- python怎么爬取excel数据(python爬取内容存入Excel实例)
- python获取网络数据tcp(Python选择网卡发包及接收数据包)
- sql server查看之前的代码(SQL Server简单实现数据的日报和月报功能)
- python3 for循环怎么用(Python3.5基础之变量、数据结构、条件和循环语句、break与continue语句实例详解)
- python函数调用传递数组数据(python调用c++传递数组的实例)
- sqlserver设置自动备份的注意事项(SQL server 定时自动备份数据库的图文方法)
- 数据类型typescript知多少(一文了解TypeScript数据类型)
- php查询数据库给变量赋值(详解PHP变量传值赋值和引用赋值变量销毁)
- SQL数据库存储过程示例解析(SQL数据库存储过程示例解析)
- angularjs数据绑定类指令及作用(详解Angular数据绑定及其实现方式)
- sqlserver存储过程同步数据(SQL Server存储过程同时返回分页结果集和总数)
- python获取特定时间日期的数据(Python提取特定时间段内数据的方法实例)
- python数据类型基本知识入门(Python Pexpect库的简单使用方法)
- docker数据卷是什么(Docker数据卷容器创建及使用方法解析)
- 网红直播可以赚很多钱吗(网红直播可以赚很多钱吗)
- 今天是什么日子(今天是什么日子有什么特殊意义吗)
- 这里输入关键词(怎么输入关键词搜索)
- 34岁的舒畅,就这样走到了末路,不知会不会后悔15年前的草率决定(就这样走到了末路)
- 不走心的古装造型 舒畅 毁容式 出演,萧蔷雷出新高度(不走心的古装造型)
- 嘉南传 第22集(嘉南传第22集)
热门推荐
- sql注入测试常用的工具(Sql注入工具_动力节点Java学院整理)
- mysql缓存是什么(详解mysql查询缓存简单使用)
- php array只能放一种类型的数据(浅谈PHP array_search 和 in_array 函数效率问题)
- dedecms屏蔽规则(使用Dedecms中七个容易忽略的安全细节介绍)
- css3 图片样式处理(CSS3实现漂亮的照片墙效果的简单实例推荐)
- css中width:auto和width:100%的区别
- python常用的字符串操作方法(Python字符串的常见操作实例小结)
- 频繁变化字段如何建立索引(跳槽必备之你设计索引的原则是什么?怎么避免索引失效?)
- vuevlog制作软件(Vue实现Dialog封装)
- 使用 iosOverlay 弹出提示信息
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9