python 学习笔记之数据分析
NumPy
创建
1 | array1 = np.array([1, 2, 3, 4, 5]) |
Pandas
Pandas 核心的数据类型是 Series(数据系列)、DataFrame(数据表/数据框),分别用于处理一维和二维的数据
使用场景
获取及修改指定数据
1 | sales_df.loc[index, "name"] |
排序
1 | df=df.sort_values('price',ascending=True) |
df 数据拼接
1 | all_emp_df = pd.concat([emp_df, emp2_df]) |
遍历数据
1 | # 使用 iterrows() 遍历 DataFrame |
按数值范围分桶
1 | bins = [0, 100, 200, 300, 400, 500, 1000, 2000, 3000] |
分组求和
1 | click_count_by_price = df.groupby(price_groups)['click_sum'].sum() |