在Day 56的跨部门协同模拟中,IT负责人往往被误认为是最容易扮演的角色。
很多人以为,IT负责人就是说一句:「技术上可以实现,但需要6个月。」
但真相是:IT负责人是整个项目中最难当的角色之一。
为什么?
因为IT负责人需要同时平衡四个看似矛盾的要求:
- 业务方说:「我要的越快越好。」
- 技术团队说:「我们已经忙不过来了。」
- 财务部说:「这个预算太高了。」
- 老板说:「为什么IT项目总是延期?」
💔 一个IT总监的真实一周
让我们走进某造车新势力IT总监李明的一周(2024年9月2日-6日)。
周一早上:突如其来的“紧急项目”
李明刚到办公室,售后总监就找到他:
售后总监:「李总,我们要做一个智能预约系统,这个是老板亲自点名的项目,需要在今年Q4上线。技术上能实现吗?」
李明:「能说说具体需求吗?」
售后总监:「就是让客户能在手机APP上预约售后服务,系统自动分配门店和时间,AI智能诊断,等等。详细需求我这周给你。你先告诉我能不能做,需要多久?」
李明心里叫苦:「又来了一个‘需求不明确、时间很紧急’的项目。」
但他不能直接拒绝,因为:
- 这是老板点名的项目
- 业务部门正在等他的回复
- 如果说“不能做”,会被认为“不支持业务”
李明的回复:
「方向上没问题,但我需要看到详细需求才能给出准确的开发周期。初步估计,如果功能复杂度中等,至少需要8-10个月。但我们现在有几个问题:
- 我们团队现在有CRM、ERP、数据中台三个大项目在并行
- 开发人员已经超负荷运转
- Q4上线的话,需要砍掉其他项目或者增加人手。」
售后总监:「8-10个月?那不是要到明年了?不行,老板说了今年必须上。你能不能压缩到6个月?」
李明感觉头疼欲裂。
周二下午:老板的“灵魂追问”
周二,老板召开了一个快速会议:
CEO:「李明,听说你们的CRM项目又延期了?这已经是第几次延期了?」
李明:「是的,主要是因为:
- 业务方中期改了需求,增加了20%的新功能
- 第三方接口对接比预期复杂,多花了1个月
- 核心开发人员离职,新人需要交接
我们预计再迟1个月可以上线。」
CEO:「每次都有原因,但每次都延期。你知道吗,业务部门现在对IT部门意见很大,他们觉得IT成了他们发展的瓶颈。你怎么看?」
李明:「我明白他们的情绪,但我们真的已经很努力了。我们团队过去3个月平均每天加班到2小时,周末也经常加班。但现在同时有太多项目在并行...」
CEO:「我不想听过程,我只想知道结果。你能确保下个月上线吗?」
李明:「我尽力。」
走出会议室,李明心情沉重。
周三晚上:技术团队的崩溃
周三晚上8点,李明正在加班,突然收到一封邮件:
邮件主题:离职申请
发件人:张华(核心开发,团队里的技术骨干)
邮件内容:「李总,很抱歉在这个时候提离职。但我真的坚持不下去了。过去6个月,我几乎每天都在加班到晚上10点以后,周末也经常被叫到公司解决线上问题。我的身体已经出现问题,医生说我再这样下去可能会有心血管问题。我需要休息。」
李明看完邮件,感觉天旋地转。
这已经是他今年第5个离职的核心开发了。
离职原因都是一样的:长期超负荷工作,身体和家庭无法承受。
周四上午:与业务方的“翻译工作”
周四,销售总监找到李明:
销售总监:「李总,我们需要在门店系统里加一个功能,就是客户进店的时候,系统能自动识别他是老客户还是新客户,然后推送他的信息给销售顾问。很简单,就是一个弹窗。你们能不能快速开发一下?」
李明听完,开始“翻译”:
李明:「这个需求听起来简单,但实际上比较复杂:
- 身份识别:是通过什么方式识别?手机号、车牌id,还是人脸识别?如果是人脸识别,需要在每个门店装摄像头,这涉及硬件采购和隐私政策
- 数据打通:需要把CRM系统、DMS系统、会员系统的数据打通,这涉及数据中台改造
- 实时推送:需要建立实时消息推送机制,这对系统性能有要求
- 隐私合规:客户数据的使用需要客户授权,需要法务部门审核
初步估计,这个项目需要2-3个月。」
销售总监:「2-3个月?那么久?我看别的公司都有这个功能,应该很常见吧?你们能不能加快速度?」
李明:「别的公司可能他们的系统架构本身就支持,但我们的系统是5年前建的,当时没有考虑这个场景。现在要加,需要改底层架构。如果你们特别紧急,我们可以先做一个简化版,只通过手机号识别,1个月可以上线。但功能会弱一些。」
销售总监:「那就先做简化版,快速上线。」
李明又多了一个项目。
周五下午:一个不眠之夜
周五晚上9点,李明刚躁在沙发上想休息一下,电话响了。
运维经理:「李总,不好了!CRM系统崩了!全国所有门店都登不上去!」
李明:「什么情况?」
运维经理:「刚才发布了一个小版本,结果数据库连接池出现问题,导致系统崩溃。现在正在紧急回滚。」
李明:「发布前没有在测试环境充分测试吗?」
运维经理:「测试了,但测试环境的数据量和生产环境不一样,没有模拟出高并发场景。」
李明立刻冲到公司,和团队一起加班到凌晨2点,才修复了问题。
第二天,他收到了老板的邮件:「昨晚的事故影响了业务运营,请书面说明原因和改进措施。」
🔍 IT负责人的四重夹击
通过李明的一周,我们可以看到IT负责人面临的四重夹击:
夹击1:需求与资源 - 业务想要的太多,技术能给的太少
业务方的视角:
- 「这个功能别人都有,为什么我们没有?」
- 「这个需求很简单呀,就是加一个按钮。」
- 「我们竞争对手1个月就上线了,为什么我们需要3个月?」
技术团队的现实:
- 每个需求看起来都很简单,但加起来是巨大的工作量
- 现有系统架构老旧,每次增加新功能都需要大量改造
- 人员有限,同时并行的项目太多
- 技术债务积累,系统稳定性嶌嶌可危
真实案例:一个“简单需求”的真相
2023年5月,某自主品牌业务部门提了一个「简单需求」:
「在门店工单系统里,增加一个‘客户满意度评价’功能。就是客户服务完成后,系统发个短信给客户,让他们点5星。很简单,就和淘宝评价一样。」
IT负责人王强的分析:
「这个需求表面上看起来很简单,但实际上涉及:
阶段1:短信发送
- 需要对接第三方短信服务商API
- 需要设计短信模板,考虑不同场景
- 需要处理发送失败的重试机制
- 工作量:3人天
阶段2:评价页面
- 需要设计H5评价页面(支持25星+文字评价)
- 需要适配各种手机型号和浏览器
- 需要防刷机制(同一客户只能评价1次)
- 工作量:5人天
阶段3:数据存储
- 需要设计数据库表结构
- 需要考虑数据备份和恢复
- 需要设计索引优化查询性能
- 工作量:2人天
阶段4:数据统计和展示
- 需要开发后台统计页面(按门店、按技师、按时间的多维分析)
- 需要实时计算NPS得分
- 需要生成各种报表
- 工作量:8人天
阶段5:与现有系统集成
- 需要从工单系统获取客户手机号
- 需要从客户系统获取客户基本信息
- 需要将评价结果同步到CRM系统
- 工作量:5人天
阶段6:测试
- 功能测试:测试各种场景和边界条件
- 性能测试:模拟高并发场景
- 容灾测试:模拟网络故障、数据库故障等
- 工作量:10人天
总计:33人天,约3个人做2周。
而且这还没有算上:
- 需求沟通和确认的时间
- 项目管理和文档编写的时间
- 上线后的运维支持时间」
业务方的反应:
「这么复杂?我看淘宝的评价功能很简单呀。你们能不能先做一个最简单的版本?就是发短信+收集评价,其他功能后面再加。」
王强的回应:
「可以,但最简单的版本也需要至少15人天,约1周时间。而且后续如果要加功能,可能需要推倒重做。」
最终结果:
这个「简单需求」整整做了5周,中间还经历了2次大改版。
这个案例告诉我们:IT负责人需要帮助业务方理解,看起来简单的需求,背后的技术实现可能非常复杂。
夹击2:时间与质量 - 业务要快,技术要稳
业务方的诉求:
- 「市场机会转瞬即逝,我们必须快速上线。」
- 「竞争对手已经有了,我们不能落后。」
- 「先上线再说,有问题再修。」
IT的担忧:
- 「如果为了赶时间而缩减测试,上线后出问题怎么办?」
- 「系统不稳定会影响用户体验,最终损害的还是业务。」
- 「每次“快速上线”都留下技术债务,累积到一定程度系统就会崩溃。」
真实案例:一次“快速上线”的惨痛代价
2022年11月,某新能源车企要赶在「双11」之前上线一个「秒杀活动」功能。
时间线:
- 10月20日:业务方提出需求
- 10月25日:IT评估后给出方案,需要3周开发+1周测试
- 10月26日:业务方坚持要求必须11月10日上线(还有15天)
IT总监张强的决策:
张强知道这是老板重点关注的项目,不能拒绝。他让团队**“加速开发”**:
- 减少测试时间:从1周压缩到3天
- 简化功能:去掉一些「不重要」的细节
- 增加人力:从其他项目抽调2个开发
- 全员加班:包括周末
11月9日晚上11点,系统终于上线了。
11月11日早上0点,秒杀活动正式开始。
11月11日早上0点05分,灾难发生了:
- 系统崩溃:并发量超出预期10倍,数据库直接拒绝服务
- 订单丢失:部分客户支付成功但订单没有生成
- 重复扣款:部分客户被重复扣款2-3次
- 退款失败:退款机制没有充分测试,部分退款失败
后果:
- 紧急停止活动,修复系统
- 人工处理超过3000个问题订单
- 赔偿客户损失约200万元
- 公司声誉受损,社交媒体上大量负面评论
- 张强被问责,取消年终奖
事后复盘:
主要问题:
- 性能测试不足:没有充分模拟高并发场景
- 事务处理缺陷:支付和订单生成没有在同一事务里,导致数据不一致
- 错误处理机制缺失:异常情况下的容错和退款机制没有完善
- 监控告警不足:系统出现问题后没有立即告警
这些问题,如果给具1周的测试时间,都能发现和解决。
张强事后反思:
「这次事故给我最大的教训就是:不能为了赶时间而牺牲质量。技术上,有些时间是不能压缩的,比如测试。如果业务方坚持要求赶时间,我不能单纯地妖协,而要明确告诉他们风险,让他们自己决策是否接受这个风险。」
这个案例告诉我们:IT负责人必须在速度和质量之间找到平衡,不能为了迎合业务而置风险于不顾。
夹击3:创新与稳定 - 业务要新,系统要稳
业务方的期待:
- 「我们要用最新的AI技术,让产品更智能。」
- 「竞争对手都在用大模型,我们也要。」
- 「这个新技术很火,我们要立刻应用。」
IT的顾虑:
- 「新技术还不成熟,生产环境使用有风险。」
- 「我们现有系统还有很多稳定性问题没解决。」
- 「每引入一个新技术,都会增加系统复杂度和维护成本。」
真实案例:一次AI应用的“翻车”
2024年3月,某豪华品牌决定在客服系统中引入大语言模型(LLM,Large Language Model),实现智能客服。
项目背景:
- 老板在一次行业峰会上看到ChatGPT演示,非常震撼
- 立即要求IT部门在公司产品中应用
- 目标:3个月内上线,替代50%的人工客服
IT总监李佳的决策:
李佳知道这是老板的「一号工程」,不能拒绝。但他也知道风险很大:
- 技术风险:LLM的输出不可控,可能会给