什么是非监督学习?
深度案例:客户精细化分群
业务背景
某新能源车企保有客户8万,采用粗放式管理:统一短信、统一促销、统一服务。
问题:营销费用高但转化率低(短信打开率仅8%)、高价值客户流失、低价值客户占用大量资源。
K-Means聚类分析
收集8万客户的50个特征(消费行为、到店行为、互动行为、服务体验、客户属性),运行K-Means算法,自动分为5个群体:
群体1:VIP忠诚客户(15%,12,000人)
- 年消费8,500元(最高)、到店频次4.5次/年
- APP活跃度高、满意度92分、投诉率2%
- 价值:贡献售后收入的45%
群体2:潜力成长客户(25%,20,000人)
- 年消费4,200元、消费趋势持续增长
- 特征:未来的VIP储备军
群体3:价格敏感客户(30%,24,000人)
- 年消费2,800元、促销活动参与度90%+
- 特征:对价格敏感,促销才来
群体4:睡眠流失风险客户(20%,16,000人)
- 年消费1,500元、平均150天未到店
- 风险:不干预,6个月内流失率>60%
群体5:高成本低价值客户(10%,8,000人)
- 年消费3,000元、但投诉率极高(月均1.5次)
- 问题:贡献5%收入,消耗18%服务成本
差异化运营策略
基于5个群体制定精细化策略:
- VIP忠诚客户:专属服务顾问、VIP休息室、免费上门取送车(投入200万/年)
- 潜力成长客户:会员升级计划、增值服务体验券(投入150万/年,3年内30%转化为VIP)
- 价格敏感客户:错峰优惠、套餐销售、自动化营销(投入80万/年,利润率提升8%)
- 睡眠流失风险客户:召回活动、服务经理致电(投入100万/年,唤醒30%)
- 高成本低价值客户:引导到独立售后、标准化服务(投入20万/年,成本降低200万)
总投入:550万元
总产出:新增收入1,900万 + 成本节约200万 = 2,100万
ROI:282%
实施6个月后效果
- VIP客户流失率:8% → 2.5%(-69%)
- 潜力客户转化率:5% → 12%(+140%)
- 营销ROI:120% → 380%(+217%)
- 客户满意度NPS:58 → 71(+22%)
- 售后收入:月均800万 → 950万(+19%)
故障模式聚类分析
业务场景
某车企每月1.2万个故障工单,传统方式是每个工单单独处理,无法识别批量性问题。
聚类发现的关键模式
对过去2年30万条故障记录进行聚类,自动聚为18个故障模式,关键发现:
模式1:早期电池衰减综合征(8%,24,000例)
- 特征组合:车龄18-24个月 + 快充>200次 + 高温地区 + 续航下降>15%
- 行动:主动召回3,200辆车预防性检测,78%确实存在隐患
- 节省质保成本8,500万元
模式2:冬季低温充电异常(6%,18,000例)
- 特征:11月-2月、气温<0°C、夜间户外停车
- 洞察:这不是故障,是低温保护机制,但客户不理解
- 行动:APP增加"冬季充电提示",投诉率下降65%
模式3:高频快充连锁反应(4%,12,000例)
- 特征:周均快充>4次(网约车)+ 电池温度>45°C
- 行动:推出"营运车辆专属保养计划",延长电池寿命25%
聚类算法对比
K-Means聚类
- 优点:速度快、适合大数据、效果稳定
- 缺点:需要预设K值、对初始点敏感
- 适用:客户分群(数据量大)
层次聚类
- 优点:不需要预设K值、可看到不同层次结构
- 缺点:速度慢、资源消耗大
- 适用:故障模式分析(探索性,数据量<10万)
DBSCAN密度聚类
- 优点:发现任意形状的群、识别异常点
- 缺点:参数设置需经验
- 适用:异常检测、地理位置分群
如何确定最佳分群数量K?
方法1:肘部法则(Elbow Method)
尝试不同K值,计算群内误差平方和(SSE),找到曲线"肘部"(拐点)
示例:
- K=2,SSE=10000
- K=3,SSE=7000
- K=4,SSE=5000
- K=5,SSE=4500 ← 肘部(下降变缓)
- K=6,SSE=4300
方法2:轮廓系数(Silhouette Score)
衡量对象与所在群的相似度,范围-1到1,越接近1越好
示例:K=5时轮廓系数最高(0.58)
方法3:业务导向法
基于业务场景和资源约束:
- 如果只有3个服务等级,分3群
- 如果有5个运营团队,分5群
实战建议:技术最优(肘部法则+轮廓系数)+ 业务可行 = 最佳方案
聚类结果的解读与命名
聚类算法只给你"群1、群2、群3",解读和命名需要人类的业务洞察。
解读步骤
步骤1:查看每个群的特征均值
步骤2:识别显著特征
- 群1:高消费、高频、高满意度 → VIP忠诚客户
- 群4:低消费、极低频、沉默 → 睡眠流失风险客户
步骤3:创建客户画像
以"VIP忠诚客户"为例:
- 张先生,35岁,企业中层
- 2年前购买高配车型
- 每3个月到店,只选原厂配件
- 年消费8000-10000元
- 从不投诉,已推荐3位朋友购车
实战要点
聚类前的数据准备
- 特征标准化:不同特征的量纲差异大(年消费:几千元,到店频次:1-5次),必须标准化到相同尺度
- 异常值处理:极端值会影响聚类效果
- 特征选择:选择对分群有意义的特征
聚类后的验证
- 业务合理性:分群结果是否符合业务直觉?
- 可操作性:能否基于分群制定差异化策略?
- 稳定性:换一批数据,结果是否稳定?
下一节预告:Day 18 知识点1 - 时间序列预测 | 预见未来的科学