pandas的一些使用技巧
这两天用pandas做数据分析时学习到一些技巧,在这里记录下来备以后使用。
目录
1 将从MySQL数据库中查询的结果转换为DataFrame类型
2 使用groupby函数以某一列为键计算另一列的平均值
3 使用lambda表达式执行逐元素操作
4 使用reset_index函数还原索引
5 使用head函数查看DataFrame中的前几条样本
6 使用shape属性查看DataFrame对象的形状
7 使用columns属性查看和修改DataFrame对象的列信息
8 使用merge函数进行两个DataFrame对象的连接
9 使用drop函数删除某列
10 使用concat对两个DataFrame对象进行拼接
11 使用drop_duplicates函数剔除重复样本
12 将DataFrame对象写入数据库
1 将从MySQL数据库中查询的结果转换为DataFrame类型 df1 = pd.DataFrame(list(results1), columns=['user_id', 'car_id'], dtype=np.int) 注意这里要先把查询的结果用list()函数转化一下。
2 使用groupby函数以某一列为键计算另一列的平均值 import pandas as pd
车型维度评分信息
df1 = pd.DataFrame({'car_id': ['221', '222', '223', '224', '225', '227', '221'], 'feature1': [1, 2.9333, 3, 4, 5, 6.3, 3], 'feature2': [5, 4, 3, 2, 1, 9, None]}) print('df1:') print(df1)
