Day 38-8：数据可视化 — 让数字会说话-似水流年

开篇：一张图胜过千言万语

2024年3月，某汽车集团的CEO李总在季度会议上说：

我不想看密密麻麻的Excel表格，我要5分钟内看懂我们50个门店的运营情况，告诉我哪些好、哪些差、为什么、怎么办。

运营总监王经理用Python生成了一份可视化报告，包含：

一张热力地图显示各门店NPS分布
一张折线图展示3个月的营收趋势
一张柱状图对比各战区表现
一张散点图分析客单价与满意度关系

CEO看了5分钟，立即做出3个决策，会议提前1小时结束。

这就是数据可视化的威力。今天，我将教你如何为分析结果添加专业级的可视化图表。

为什么需要数据可视化？

大脑处理图像的速度是文字的60000倍

想象两个场景：

场景A：纯数字表格

门店        NPS    营收
北京朝阳店   68.5   395万
上海浦东店   65.2   428万
深圳南山店   32.1   218万
...

场景B：可视化图表

一个颜色鲜明的柱状图，红色标注深圳南山店
一眼就能看出它明显低于其他门店

你觉得哪个更直观？

可视化的三个核心价值

快速传达信息：5秒看懂数据趋势
发现隐藏规律：看见数字背后的故事
辅助决策：让管理者快速做决策

Python中的可视化工具

主流可视化库对比

库名	中文名	特点	适用场景
Matplotlib	基础绘图库	功能全面，自定义性强	学术报告、基础图表
Seaborn	统计可视化库	美观，统计分析强	数据分析报告
Plotly	交互式图表库	可交互，专业	仪表板、网页展示
Pyecharts	百度ECharts的Python版	中文友好，动态图表	业务报告

我们今天重点学习Matplotlib和Seaborn，它们是最常用的组合。

安装可视化库

pip install matplotlib seaborn

第一个可视化：门店NPS柱状图

需求

我们要绘制一个柱状图，展示各门店的NPS得分，并用颜色区分等级：

绿色：A级门店（NPS >= 60）
黄色：B级门店（50 <= NPS < 60）
橙色：C级门店（40 <= NPS < 50）
红色：D级门店（NPS < 40）

完整代码

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

# 设置中文字体（解决中文显示问题）
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用黑体
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题

# 设置seaborn样式
sns.set_style('whitegrid')

# 假设我们有门店NPS数据
store_nps = {
    '上海浦东店': 68.5,
    '北京朝阳店': 65.2,
    '杭州西湖店': 62.8,
    '广州天河店': 58.3,
    '成都春熙店': 54.7,
    '武汉江汉店': 48.5,
    '西安雁塔店': 45.2,
    '深圳南山店': 32.1
}

# 转换为DataFrame并排序
df_plot = pd.DataFrame(list(store_nps.items()), 
                       columns=['门店', 'NPS'])
df_plot = df_plot.sort_values('NPS', ascending=False)

# 定义颜色映射函数
def get_color(nps):
    if nps >= 60:
        return '#2ecc71'  # 绿色 - A级
    elif nps >= 50:
        return '#f39c12'  # 橙色 - B级
    elif nps >= 40:
        return '#e67e22'  # 深橙色 - C级
    else:
        return '#e74c3c'  # 红色 - D级

# 为每个门店分配颜色
colors = [get_color(nps) for nps in df_plot['NPS']]

# 创建图表
fig, ax = plt.subplots(figsize=(12, 6))

# 绘制柱状图
bars = [ax.bar](http://ax.bar)(df_plot['门店'], df_plot['NPS'], color=colors, alpha=0.8)

# 添加数值标签
for i, (store, nps) in enumerate(zip(df_plot['门店'], df_plot['NPS'])):
    ax.text(i, nps + 1, f'{nps}', ha='center', va='bottom', 
            fontsize=10, fontweight='bold')

# 添加分级线
ax.axhline(y=60, color='green', linestyle='--', linewidth=1, alpha=0.5, label='A级线')
ax.axhline(y=50, color='orange', linestyle='--', linewidth=1, alpha=0.5, label='B级线')
ax.axhline(y=40, color='red', linestyle='--', linewidth=1, alpha=0.5, label='C级线')

# 设置标题和标签
ax.set_title('各门店NPS得分排名', fontsize=16, fontweight='bold', pad=20)
ax.set_xlabel('门店', fontsize=12)
ax.set_ylabel('NPS得分', fontsize=12)

# 旋转x轴标签
plt.xticks(rotation=45, ha='right')

# 添加图例
ax.legend(loc='upper right')

# 调整布局
plt.tight_layout()

# 保存图表
plt.savefig('门店NPS排名.png', dpi=300, bbox_inches='tight')

# 显示图表
[plt.show](http://plt.show)()

关键技巧解析：

中文字体设置：plt.rcParams['font.sans-serif'] = ['SimHei'] 解决中文显示问题
颜色映射：用函数自动分配颜色，代码更简洁
数值标签：ax.text() 在柱子上方显示具体数值
参考线：ax.axhline() 添加分级标准线
高清保存：dpi=300 保证打印质量

第二个可视化：营收趋势折线图

需求

绘制各战区10-12月的营收趋势，对比各战区表现。

代码实现

# 准备数据
months = [10, 11, 12]
regions = ['华东战区', '华南战区', '华北战区', '华西战区', '东北战区']

# 模拟各战区每月营收（单位：万元）
revenue_data = {
    '华东战区': [1650, 1780, 1820],
    '华南战区': [1380, 1420, 1480],
    '华北战区': [1520, 1590, 1630],
    '华西战区': [850, 910, 970],
    '东北战区': [480, 490, 510]
}

# 创建图表
fig, ax = plt.subplots(figsize=(12, 7))

# 为每个战区绘制折线
for region, revenues in revenue_data.items():
    ax.plot(months, revenues, marker='o', linewidth=2.5, 
            markersize=8, label=region)

    # 在每个点上标注数值
    for month, revenue in zip(months, revenues):
        ax.text(month, revenue + 30, f'{revenue}', 
                ha='center', va='bottom', fontsize=9)

# 设置标题和标签
ax.set_title('各战区Q4季度营收趋势', fontsize=16, fontweight='bold', pad=20)
ax.set_xlabel('月份', fontsize=12)
ax.set_ylabel('营收（万元）', fontsize=12)

# 设置x轴刻度
ax.set_xticks(months)
ax.set_xticklabels(['10月', '11月', '12月'])

# 添加网格
ax.grid(True, alpha=0.3, linestyle='--')

# 添加图例
ax.legend(loc='upper left', fontsize=10)

# 调整布局
plt.tight_layout()

# 保存
plt.savefig('战区营收趋势.png', dpi=300, bbox_inches='tight')
[plt.show](http://plt.show)()

洞察提示：

从这张图可以看出：

华东战区领先，且增长稳定
东北战区垫底，增长乏力（需要重点关注）
所有战区都呈现增长趋势（Q4旺季效应）

第三个可视化：客单价与满意度散点图

需求

探索客单价与客户满意度的关系，看看是否存在相关性。

代码实现

import numpy as np

# 模拟数据（实际应该从df_clean中提取）
np.random.seed(42)
n_samples = 500

# 生成客单价数据（800-3000元）
avg_amounts = np.random.normal(1500, 400, n_samples)
avg_amounts = np.clip(avg_amounts, 800, 3000)

# 生成满意度数据（有轻微正相关）
ratings = 3.5 + (avg_amounts - 1500) / 2000 + np.random.normal(0, 0.5, n_samples)
ratings = np.clip(ratings, 1, 5)

# 创建DataFrame
df_scatter = pd.DataFrame({
    '客单价': avg_amounts,
    '满意度': ratings
})

# 创建图表
fig, ax = plt.subplots(figsize=(10, 7))

# 绘制散点图，根据满意度着色
scatter = ax.scatter(df_scatter['客单价'], df_scatter['满意度'], 
                    c=df_scatter['满意度'], cmap='RdYlGn', 
                    s=50, alpha=0.6, edgecolors='black', linewidth=0.5)

# 添加趋势线
z = np.polyfit(df_scatter['客单价'], df_scatter['满意度'], 1)
p = np.poly1d(z)
ax.plot(df_scatter['客单价'].sort_values(), 
        p(df_scatter['客单价'].sort_values()), 
        'r--', linewidth=2, alpha=0.8, label='趋势线')

# 添加颜色条
cbar = plt.colorbar(scatter, ax=ax)
cbar.set_label('满意度评分', rotation=270, labelpad=20)

# 计算相关系数
correlation = df_scatter['客单价'].corr(df_scatter['满意度'])

# 设置标题和标签
ax.set_title(f'客单价与客户满意度关系\n（相关系数：{correlation:.3f}）', 
            fontsize=14, fontweight='bold', pad=20)
ax.set_xlabel('客单价（元）', fontsize=12)
ax.set_ylabel('满意度评分（1-5分）', fontsize=12)

# 添加图例
ax.legend(loc='lower right')

# 添加网格
ax.grid(True, alpha=0.3, linestyle='--')

# 调整布局
plt.tight_layout()

# 保存
plt.savefig('客单价与满意度关系.png', dpi=300, bbox_inches='tight')
[plt.show](http://plt.show)()

业务洞察：

如果相关系数接近0：客单价与满意度无明显关系
如果相关系数为正：客单价越高，满意度越高（说明高价值服务做得好）
如果相关系数为负：客单价越高，满意度越低（警告：高价格但服务差）

第四个可视化：门店分级雷达图

需求

用雷达图展示标杆门店的多维度表现（营收、NPS、客单价、工单数等）。

代码实现

import numpy as np
from math import pi

# 准备数据
categories = ['营收', 'NPS', '客单价', '工单数', '客户数']
N = len(categories)

# 两个门店的数据（标准化到0-100）
store_a = [95, 88, 85, 90, 92]  # 标杆门店
store_b = [45, 35, 40, 50, 38]  # 需改进门店

# 计算角度
angles = [n / float(N) * 2 * pi for n in range(N)]
store_a += store_a[:1]
store_b += store_b[:1]
angles += angles[:1]

# 创建图表
fig, ax = plt.subplots(figsize=(10, 10), subplot_kw=dict(projection='polar'))

# 绘制门店A
ax.plot(angles, store_a, 'o-', linewidth=2, label='上海浦东店（A级）', color='#2ecc71')
ax.fill(angles, store_a, alpha=0.25, color='#2ecc71')

# 绘制门店B
ax.plot(angles, store_b, 'o-', linewidth=2, label='深圳南山店（D级）', color='#e74c3c')
ax.fill(angles, store_b, alpha=0.25, color='#e74c3c')

# 设置刻度标签
ax.set_xticks(angles[:-1])
ax.set_xticklabels(categories, size=12)

# 设置y轴范围
ax.set_ylim(0, 100)

# 添加网格
ax.grid(True)

# 添加图例
ax.legend(loc='upper right', bbox_to_anchor=(1.3, 1.1))

# 添加标题
plt.title('门店多维度对比分析', size=16, fontweight='bold', pad=20)

# 调整布局
plt.tight_layout()

# 保存
plt.savefig('门店雷达图.png', dpi=300, bbox_inches='tight')
[plt.show](http://plt.show)()

雷达图的优势：

一眼就能看出两个门店的全方位差距，方便找出改进方向。

第五个可视化：综合仪表板

需求

在一张图中展示多个关键指标，形成管理仪表板。

代码实现

# 创建2x2子图布局
fig = plt.figure(figsize=(16, 12))

# 子图1：门店NPS柱状图（左上）
ax1 = plt.subplot(2, 2, 1)
store_names = list(store_nps.keys())[:5]
nps_values = list(store_nps.values())[:5]
colors1 = [get_color(nps) for nps in nps_values]
ax1.barh(store_names, nps_values, color=colors1, alpha=0.8)
ax1.set_xlabel('NPS得分')
ax1.set_title('TOP5门店NPS', fontweight='bold')
ax1.grid(axis='x', alpha=0.3)

# 子图2：战区营收饼图（右上）
ax2 = plt.subplot(2, 2, 2)
region_revenue = [1820, 1480, 1630, 970, 510]
region_names = ['华东', '华南', '华北', '华西', '东北']
colors2 = ['#3498db', '#e74c3c', '#2ecc71', '#f39c12', '#9b59b6']
wedges, texts, autotexts = ax2.pie(region_revenue, labels=region_names, 
                                     autopct='%1.1f%%', colors=colors2, 
                                     startangle=90)
ax2.set_title('各战区营收占比', fontweight='bold')

# 子图3：月度趋势图（左下）
ax3 = plt.subplot(2, 2, 3)
months_full = ['10月', '11月', '12月']
total_revenue = [5380, 5690, 5910]
ax3.plot(months_full, total_revenue, marker='o', linewidth=2.5, 
        markersize=10, color='#3498db')
ax3.fill_between(range(len(months_full)), total_revenue, alpha=0.3, color='#3498db')
for i, v in enumerate(total_revenue):
    ax3.text(i, v + 50, f'{v}万', ha='center', va='bottom', fontweight='bold')
ax3.set_ylabel('总营收（万元）')
ax3.set_title('整体营收趋势', fontweight='bold')
ax3.grid(True, alpha=0.3)

# 子图4：服务类型对比（右下）
ax4 = plt.subplot(2, 2, 4)
service_types = ['保养', '维修']
order_counts = [78520, 38320]
service_nps = [61.5, 42.8]
x = np.arange(len(service_types))
width = 0.35
bar1 = [ax4.bar](http://ax4.bar)(x - width/2, order_counts, width, label='工单数', color='#3498db', alpha=0.8)
ax4_twin = ax4.twinx()
bar2 = ax4_[twin.bar](http://twin.bar)(x + width/2, service_nps, width, label='NPS', color='#e74c3c', alpha=0.8)
ax4.set_xlabel('服务类型')
ax4.set_ylabel('工单数', color='#3498db')
ax4_twin.set_ylabel('NPS得分', color='#e74c3c')
ax4.set_xticks(x)
ax4.set_xticklabels(service_types)
ax4.set_title('服务类型对比', fontweight='bold')
ax4.legend(loc='upper left')
ax4_twin.legend(loc='upper right')

# 添加总标题
fig.suptitle('Q4季度售后服务运营仪表板', fontsize=18, fontweight='bold', y=0.98)

# 调整子图间距
plt.tight_layout(rect=[0, 0, 1, 0.96])

# 保存
plt.savefig('运营仪表板.png', dpi=300, bbox_inches='tight')
[plt.show](http://plt.show)()

仪表板的价值：

CEO只需看这一张图，5分钟内了解全局
各维度数据一目了然
便于快速决策

关键收获

通过本节学习，你掌握了：

✅ 可视化基础：Matplotlib和Seaborn的使用

✅ 柱状图：对比类数据的最佳选择

✅ 折线图：展示趋势变化

✅ 散点图：探索变量关系

✅ 雷达图：多维度综合对比

✅ 仪表板：综合展示关键指标

✅ 图表美化：颜色、标签、图例的专业设置

更重要的是：你学会了如何让数据说话，让管理者快速做决策。

可视化的黄金法则

1. 选对图表类型

对比大小：柱状图、条形图
展示趋势：折线图、面积图
显示占比：饼图、环形图
分布情况：直方图、箱线图
相关关系：散点图
多维对比：雷达图

2. 配色要专业

用红色表示警告、差
用绿色表示良好、优
用蓝色表示中性、稳定
避免使用过多颜色（最多5-7种）

3. 简洁胜于复杂

去掉不必要的装饰
突出核心信息
适当留白

4. 数据标签要清晰

坐标轴要有单位
图例要说明清楚
重要数值要标注

恭喜你完成了Day 38的全部学习！

从环境搭建、基础语法、数据处理、实战分析、自动化流程到数据可视化，你已经掌握了完整的Python数据分析技能链。

现在，你可以：

✅ 独立完成门店数据的自动化分析
✅ 生成专业的数据分析报告
✅ 用可视化图表辅助管理决策
✅ 把工作效率提升10倍以上

下一步建议：

把今天学到的技能应用到实际工作中
尝试分析你手头的真实数据
持续优化你的自动化脚本
学习更高级的分析技术（机器学习、预测模型等）

记住：最好的学习方式是实践。现在就开始，用Python解决一个实际问题吧！ ?

Day 38-8：数据可视化 — 让数字会说话

开篇：一张图胜过千言万语

为什么需要数据可视化？

大脑处理图像的速度是文字的60000倍

可视化的三个核心价值

Python中的可视化工具

主流可视化库对比

安装可视化库

第一个可视化：门店NPS柱状图

需求

完整代码

第二个可视化：营收趋势折线图

需求

代码实现

第三个可视化：客单价与满意度散点图

需求

代码实现

第四个可视化：门店分级雷达图

需求

代码实现

第五个可视化：综合仪表板

需求

代码实现

关键收获

可视化的黄金法则

1. 选对图表类型

2. 配色要专业

3. 简洁胜于复杂

4. 数据标签要清晰

相关推荐

置顶推荐

最新文章

文章目录