使用pandas处理table数据,代码汇总
example 0:取出某几列/某几行
取出某几列:
取出某几个位置的几列:
取出df的10-20行:
从a列到b列的subset:
example 1:寻找dataframe某一列(’Gold’)的最大值以及最大值所在的index
example 2:找到某个观测值的某几列最大值(比如从2001-01到2001-09)
先将这几列取出来变成df_sub,比如:
(axis=1表示看行,默认是axis=0,看列)
example 3:赋值
直接用
将第a列赋值为xx
or:
总的金牌数等于冬天的金牌数加上夏天的
example 4:找到得到最多金牌数的三行
先按照想要的列sort,默认ascending
return最后的三个
example 5:有条件地选取列
当POPESTIMATE2015>POPESTIMATE2014列时
当region列等于1或者2时:
当CTYNAME这一列含有Washington时
example 7: rename
example 8: apply函数的使用
apply函数对dataframe列中每一个obs采取措施并且返回一个拼接好的series,有很大的用处。
比如:
将energy(dataframe)中的Country列名中的数字结尾和类似于(xxxstate)的格式去掉
|
|
example 9: 将旧的obs的值替换成新的
example 10: dataframe group by a dict
假设有一个dataframe(Top15)有很多country的信息,包括人口等。一个dict,mapping country to continent。现在要create 新的dataframe,用大洲信息来做index,包括了每个大洲的人口的std, mean,每个大洲的size(在dataset里含有几个country)等
|
|
example 11: 用每一组的第一行的数值去填充
example 12: 将某一列变成list并且从中找到某个数值的位置
example 13: 在dataframe里求lag
example 14: 根据条件创建新的列并且构建subset