数据重构
数据连接
数据重构方法一:concat
pd.concat([text_left_up,text_right_up],axis=1)
axis=1:按照行连接
数据重构方法二:使用DataFrame自带的方法join方法和append
- 行用join,列用append;
数据重构方法三:使用Panads的merge方法和DataFrame的append方法
- 行用merge,列用append
把pandas数据转换为series数据(stack 函数)
- 把原来一行的数据按列展开
按照属性分组
- 比如按照性别分组,计算其他属性的均值
分组之后按要求求和
- 统计泰坦尼克号中男女的存活人数
- 计算客舱不同等级的存活人数
- 统计在不同等级的票中的不同性别的船票花费的平均值
- 得出不同年龄的总的存活人数,然后找出存活人数最多的年龄段,最后计算存活人数最高的存活率(存活人数/总人数)
agg函数使用
- agg函数里面是一个字典类型的参数,理解为对Fare属性列取均值mean(),对pclass属性取求和sum()