大蟒蛇python教程共享pandas应用实例之pivot函数详解

1、pivot函数的定义

pivot(index=none,columns=none,values=none) -> dataframe  

2、pivot函数的说明

通过给定的索引(index)和列(column)的值重新生一个dataframe对象。

根据列值对数据进行整形(生成一个“透视”表)。从指定的索引/列中使用唯一的值来形成结果数据帧的轴。此函数不支持数据聚合,多个值将导致列中的多索引。

3、pivo函数的参数

index:指定一列做为生成dataframe对象的索引,如果为空则默认为原来的索引。

columns:指定一列的值作为列名,必须传值。

values:指定一列作为生成dataframe对象的值。可以为空。

4、pivot函数实例

df = pd.dataframe({'foo': ['one', 'one', 'one', 'two', 'two', 'two'],                      'bar': ['a', 'b', 'c', 'a', 'b', 'c'],                      'baz': [1, 2, 3, 4, 5, 6],                      'zoo': ['x', 'y', 'z', 'q', 'w', 't']})  

pandas应用实例之pivot函数详解

# 指定foo的值为新dataframe的index,bar的值为columns,dataframe中对应的值为baz  df.pivot(index='foo', columns='bar', values='baz')  

pandas应用实例之pivot函数详解

# 没有指定value,列名最外层保留原来的列,如下结果baz和zoo为原dataframe中的列名,新指定的列名bar在里层(暂时这么理解)。  df.pivot(index='foo', columns='bar')  

pandas应用实例之pivot函数详解

# 可以通过索引的方式取指定的列数据  df.pivot(index='foo', columns='bar')['baz']  

pandas应用实例之pivot函数详解

# 可以指定多个values  df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])  

pandas应用实例之pivot函数详解

# 指定多个columns  df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])  

pandas应用实例之pivot函数详解

# 指定多个index  df.pivot(index=['foo','bar'], columns='baz', values='zoo')  

pandas应用实例之pivot函数详解

# 指定多个index可以通过index名取当个index的数据  df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]  

pandas应用实例之pivot函数详解

# 这两行代码运行将会报错。  # 报错提示:valueerror: index contains duplicate entries, cannot reshape  # 意思是指定的索引one有两个列bar=a冲突了。  df = pd.dataframe({"foo": ['one', 'one', 'two', 'two'],                     "bar": ['a', 'a', 'b', 'c'],                     "baz": [1, 2, 3, 4]})  df.pivot(index='foo', columns='bar', values='baz')  

5、pivot函数在实际工作中解决的案例

pandas应用实例之pivot函数详解

现在要上图中的不同code之间从2020-11-16到2020-11-18三天内num序列数的相关性。

首先,dataframe对象可以直接调用函数corr()计算不同列之间的相关性,所以现在需要将原始的dataframe对象转换成以code为列,date为索引,num为值的dataframe。
第一种比较笨的方法就是循环,此方法不但代码量较多而且在数据量很大时会比较耗时。不建议使用。

grouped = df.groupby(by=["code"])  df_num = pd.dataframe()  for name,group in grouped:      d = pd.series(data=group["num"].values,name=name)      df_num = pd.concat([df_num,d],axis=1)    df_close  

pandas应用实例之pivot函数详解

第二种方法就是使用pivot函数,一行代码解决,运行快速。

df_num = df.pivot(index='date',columns='code',values='num')  

pandas应用实例之pivot函数详解

想要的形式的dataframe生成了就可以直接调用corr()函数直接求出code之间的相关性了

# 计算列之间的相关性  df_num.corr()  

pandas应用实例之pivot函数详解

总结

到此这篇关于pandas应用实例之pivot函数的文章就介绍到这了,更多相关pandas pivot函数内容请搜索<计算机技术网(www.ctvol.com)!!>以前的文章或继续浏览下面的相关文章希望大家以后多多支持<计算机技术网(www.ctvol.com)!!>!

需要了解更多python教程分享pandas应用实例之pivot函数详解,都可以关注python教程分享栏目—计算机技术网(www.ctvol.com)!

本文来自网络收集,不代表计算机技术网立场,如涉及侵权请联系管理员删除。

ctvol管理联系方式QQ:251552304

本文章地址:https://www.ctvol.com/pythontutorial/1116001.html

(0)
上一篇 2022年7月10日
下一篇 2022年7月10日

精彩推荐