- 如何用一行代码搞定数据透视表?
- 来源:未明学院
Excel中数据透视表的使用非常广泛,其实Pandas也提供了一个类似的功能,应用起来比Excel更灵活,也更强大。虽然pivot_table看起来只是一个简单的函数,但是它能够快速地进行数据分析,帮你轻松搞定繁杂冗余的数据,提升学习工作的效率。
本期我们将重点解释Pandas中的pivot_table函数,并教大家如何使用它来进行数据分析。
注意,你需要确保你理解你的数据,并清楚地知道你想通过透视表解决什么问题。
(1)预处理打开一份Excel表格,可以看到一份表格的数据量庞大,如何从繁杂冗余的数据中获取自己想要的信息,是一个让人头疼的问题。
我们来教大家怎么用一行代码获取想要的信息。
在此之前,先进行简单的数据预处理,为防止后续操作中筛选出的数据量过大,我们可以限定显示最大的函数为10行:
同理,如果想要以产地为索引,只要把“年代”索引修改成“产地”索引即可。
(3)多索引此外,也可以有多个索引。实际上,大多数的pivot_table参数可以通过列表获取多个值。我们尝试按年代和产地索引进行筛选:
(5)指定统计方法还可以指定函数来统计不同的统计值,使用aggfunc就很容易实现,比如在下图中使用Numpy的sum函数对投票人数求和:
可以看到,透视表的应用很灵活。
(6)替换非法字符非数值(NaN)难以处理,会对计算产生干扰。如果想移除它们,可以使用“fill_value”将其设置为0:
(8)灵活运用aggfunc一个很方便的特性是,为了对你选择的不同值执行不同的函数,你可以向aggfunc传递一个字典。不过,这样做有一个副作用,那就是必须将标签做的更加简洁才行。
我们尝试对各个地区的投票人数求和,对评分求均值:
(9)数据过滤
运用type函数,可以看到数据透视表是Dataframe类型的:
接下来我们按电影的年代进行排名,使用排序函数sort_values(),评分按照降序排序,设置ascending的值为False:
1924年的所有电影仅靠一小串代码就罗列出来了,是不是很轻松~
话不多说,小明已经抄下影单,准备观影了!
▼往期精彩回顾▼如何使用python制作词云图? Pandas必备技能之“表格拼接”4张思维导图系统入门Python爬虫7张思维导图掌握数据分析关键库pandasNumpy核心要点有哪些?3张思维导图帮你梳理
- END -
未明训练营火热报名中商业分析,量化金融,机器学习,深度学习
4大专题,5个精选项目任你挑选
未明学院
扫一扫下载订阅号助手,用手机发文章
赞赏
长按二维码向我转账
受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。
已同步到看一看
取消
发送
我知道了
朋友会在“发现-看一看”看到你“在看”的内容
确定
已同步到看一看写下你的想法
最多200字,当前共字
发送
已发送
朋友将在看一看看到
确定
写下你的想法...
取消
发布到看一看
确定
最多200字,当前共字
发送中
微信扫一扫
使用小程序
取消
允许
取消
允许
知道了
确定
-
-
- 那些“毁人不倦”的航校
- 自从今年3月份开始的那场沸沸扬扬的自杀事件炸锅以来,很多航校的恶性事件突然炸出水面,我们才知道我们的很多莘莘学子们在国外到底过着什么样的生活。 USAG:突然没有了结局 USAG作为导火线,自
- 飞行员带你全球GO
-
-
-
- TOP 15 | 美国汽车零部件企业排行榜
- 前言 随着中美贸易战的愈演愈烈,全球汽车行业呈整体下滑态势,那么我们的对手——世界唯一超级大国的美利坚合众国的制造业,特别是举足轻重的汽车零部件业务发展情况对我们颇具参考价值。 因此,《汽车制造中文版
- QualityIn质量学院
-
-
-
- 5位国家级著名老中医独家秘方,不到5元钱,家家都需要!
- 编者按 医学界有个怪现象:搞中医的人往往比西医长寿。这多是因为中医精通中药,善于调药,自用的养生灵药更是成为了秘方。 今天,我们请教了国内5位知名中医药大师,他们的长寿秘方其实很简单! 01 刘天湖:
- 五味古法中医
-
-
-
- 宏基因组分析软件专题(一)| 热心肠日报
- 今天是第1227期日报。 Nature子刊:宏基因组研究超强综述——从取样到分析 Nature Biotechnology [IF:31.864] ① 随着测序价格下降、配套软件的发表和更新,宏基因组
- 热心肠研究院
-
-
-
- 手缝双面羊绒大衣制作工艺
- 【精华】1300集服装手绘PS/CDR/AI教程 【实用】1300集服装手工板/CAD制版教程 【实用】800集服装平面立体裁剪视频教程 【实用】770集服装缝纫工艺制作视频教程 【稀缺】西服制版及高
- 服装设计师服装制版裁剪缝纫教程
-
-
-
- 用市场营销方法论来指导企业大学经营(二)
- 作者:钱锋Ben 培训江湖特约作者 我想成为“江湖原创作家” 如果把企业大学看作是一个独立经营的公司,这个公司有一批相对稳定的消费者,那么企业大学的运营就也可以运用市场营销的方法论来进行指导。
- 培训江湖
-
-
-
- Cell—高尔基体TPPP蛋白是控制髓鞘形成的关键蛋白
- 链接:https://www.ncbi.nlm.nih.gov/pubmed/31522887 2018年十大研究进展名录 盘点2018年阿尔茨海默病十大研究突破 盘点2018年帕金森病十大研究突破
- 神经科学临床和基础
-
-
-
- 广告:知识星球的续费说明
- 知识星球《周璐的笔记房产研讨群》以及《周璐的笔记收并购案例》已经运营了10个多月,可能有部分小伙伴已经收到了续费的通知,并开始陆续缴费了。 在此对续费做一个说明哈。 《周璐的笔记房产研讨群》出发点
- 周璐的笔记
-
-
-
- 社交信息工具的演化:从信件、Email、QQ到微信
- ▼ 本文由陈智罡博士撰写 微信大家都非常熟悉,但是如果你问:微信的本质是什么? 很多人未必能够说清楚。 大家都知道微信是社交软件,而且现在很多人都想知道下一个微信是什么。其实要想看明白未来,最好的方
- 格密链
-
-
-
- 默虹|"跳岛战术",越来越近
- 过去两年,陆战队正在加紧完善两种“跳岛”战术,一个是“远征前进基地”EABO,一个是“对抗条件下超越海岸线行动”LOCE。 一、因子 随着海军专注于“分布式”海上作战概念。新上任的陆战队第38任司
- 默虹美海军学习小站
-
-
-
- 如何用一行代码搞定数据透视表?
- Excel中数据透视表的使用非常广泛,其实Pandas也提供了一个类似的功能,应用起来比Excel更灵活,也更强大。虽然pivot_table看起来只是一个简单的函数,但是它能够快速地进行数据分析,帮
- 未明学院
-
-
-
- Durvalumab+依托泊苷/铂类一线治疗广泛期SCLC: CASPIAN研究
- 研究结论 Durvalumab联合EP方案中作为ES-SCLC的一线治疗与允许长达6个周期EP和PCI强力治疗方案相比,能显著改善OS - OS HR 0.73(95%CI 0.591-0.909;P
- 肺癌多学科会诊
-
-
-
- 原创 | 怎样巧妙的战胜自私?(《静思传习录》215)
- 这是静之兄第1049篇原创,累计原创200万字 大家好,我是静之兄,今天我们来讲《传习录》第215条。 在这一条里,王阳明谈到了如何去恶存善的问题。 我们先来看看他是怎么谈的。 如下: 黄修易问道
- 静之兄
-
-
-
- 快看看杨澄甫的金鸡独立,再看你的是否有打错?
- 语音版(预计3分21秒)普通话 - 来自漾太极 - / 03:21 杨澄甫是杨氏太极拳的第三代宗师,为传统杨氏太极拳的传承与发展作出了不可磨灭的贡献。 杨澄甫是一位有争议性的太极人物,不少人说他的定
-
-
-
- 今夜调价 | 柴油、汽油每吨均↑125元
- ● 油价调整信息 据业内机构预测,2019年9月18日晚24点,国内成品油价格或迎来上调,预计汽柴油每吨均上涨125元,折合升价92#汽油和0#柴油分别上涨0.10元/升、0.11元/升,50L家用车
- 加油站运营管理
-