pandas数据分组后的处理(详解pandas如何去掉、过滤数据集中的某些值或者某些行?)
pandas数据分组后的处理
详解pandas如何去掉、过滤数据集中的某些值或者某些行?摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。
0.导入我们需要使用的包
import pandas as pd
pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。
1.去掉某些具体值
数据集df中,对于属性appplatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。
import pandas as pd
|
df[(true - df[ 'appplatform' ].isin([ 2 ]))] |
当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appid这个属性,我们想去掉appid=278和appid=382的样本。
|
df[(true - df[ 'appid' ].isin([ 278 , 382 ]))] |
另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appplatform=2而且appid=278和appid=382的样本呢?非常简单。
|
df[(true - df[ 'appid' ].isin([ 278 , 382 ]))&(true - df[ 'appplatform' ].isin([ 2 ]))] |
其实,在这里我们看到,就是由两部分组成的,第一部分就是appid中等于278和382的,另外一部分就是appplatform中等于2的。两者取逻辑关系 与(&)
2.过滤掉某个范围的值
上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeid(第一列)中id值大于10000的样本。
|
df[df[ 'creativeid' ]< = 10000 ] |
另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。
以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
原文链接:https://blog.csdn.net/qq_22238533/article/details/76127966
- 前端模态框数据(amazeui模态框弹出后立马消失并刷新页面)
- python pandas读取数据库表(Python3.5 Pandas模块之DataFrame用法实例分析)
- sqlserver常用数据结构图(Sql Server数据库常用Transact-SQL脚本推荐)
- entity framewrk访问数据库的封装类
- thinkphp 多维度展示数据(Thinkphp自定义生成缩略图尺寸的方法)
- sqlserver设置自动备份的注意事项(SQL server 定时自动备份数据库的图文方法)
- docker容器与宿主机通信(docker容器与宿主机的数据交互方式总结)
- antdesign接收数据状态(Ant Design Blazor 组件库的路由复用多标签页功能)
- python数据分析用到的模块(python模块之subprocess模块级方法的使用)
- 查询SQL SERVER中某个数据库的每个表的数据量和每行记录所占用空间
- 宝塔数据库不小心删了(宝塔面板MySQL数据库经常自动停止的解决方法)
- docker数据卷是什么(Docker数据卷容器创建及使用方法解析)
- mysql如何给一个表批量添加字段(mysql从一张表查询批量数据并插入到另一表中的完整实例)
- dede模板手机端显示设置(DEDE模板中如何运行php脚本和变量在需要操作数据库字段时)
- laravel获取数据(laravel框架添加数据,显示数据,返回成功值的方法)
- python基本数据结构(浅谈Python编程中3个常用的数据结构和算法)
- 越南河粉(越南河粉来自哪里)
- 按这几方面养护佛肚竹盆景,保证枝叶繁茂,造型优美(按这几方面养护佛肚竹盆景)
- 冰岛旅游攻略(冰岛旅游攻略及花费八日游)
- 寒假旅游攻略(成都寒假旅游攻略)
- 菲律宾旅游攻略(菲律宾旅游攻略地图)
- 清华大学难考吗(清华大学考研录取分数线)
热门推荐
- dedecms注册会员界面如何打开(dedecms后台登录成功后返回到登录界面的解决方法)
- laravel判断变量为空(关于laravel 数据库迁移中integer类型是无法指定长度的问题)
- python怎么给rsa加密(Python生成rsa密钥对操作示例)
- html5表单实例(使用HTML5和CSS3表单验证功能)
- java上传图片压缩包(js实现多张图片打包成zip)
- python开启两个线程(Python开启线程,在函数中开线程的实例)
- SQL Server免费版的安装以及使用SQL Server Management Studio(SSMS)连接数据库的图文方法(SQL Server免费版的安装以及使用SQL Server Management StudioSSMS连接数据库的图文方法)
- vue代码和element用法(Vue Element前端应用开发之整合ABP框架的前端登录)
- 哪款香港云服务器好(选择香港云服务器租用商一般看哪几个方面?)
- 织梦网址首页如何布局(去掉织梦建站或者仿站时首页访问地址后的index.html)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9