Pandas 客户分析
介绍
在数据分析和商业智能中,客户分析是一个至关重要的环节。通过分析客户数据,企业可以更好地了解客户行为、优化营销策略并提升客户满意度。Pandas 是 Python 中一个强大的数据处理库,特别适合用于客户数据分析。本文将带你从数据加载到分析结果展示,逐步掌握如何使用 Pandas 进行客户分析。
数据加载与初步探索
首先,我们需要加载客户数据。假设我们有一个 CSV 文件 customers.csv
,包含以下字段:
CustomerID
: 客户唯一标识Name
: 客户姓名Age
: 客户年龄Gender
: 客户性别City
: 客户所在城市PurchaseAmount
: 客户购买金额PurchaseDate
: 购买日期
import pandas as pd
# 加载数据
df = pd.read_csv('customers.csv')
# 查看前5行数据
print(df.head())
输出示例:
CustomerID | Name | Age | Gender | City | PurchaseAmount | PurchaseDate |
---|---|---|---|---|---|---|
1 | Alice | 28 | Female | New York | 150.0 | 2023-01-15 |
2 | Bob | 34 | Male | Los Angeles | 200.0 | 2023-02-10 |
3 | Charlie | 22 | Male | Chicago | 75.0 | 2023-03-05 |
4 | Diana | 29 | Female | Houston | 300.0 | 2023-04-20 |
5 | Eve | 40 | Female | Phoenix | 50.0 | 2023-05-12 |
数据清洗
在分析之前,我们需要确保数据的质量。常见的数据清洗步骤包括处理缺失值、删除重复数据以及转换数据类型。
1. 处理缺失值
# 检查缺失值
print(df.isnull().sum())
# 填充缺失值(例如用平均值填充年龄)
df['Age'].fillna(df['Age'].mean(), inplace=True)