售后服务
我们是专业的

Day 56-5:IT负责人视角 - 技术可行性与系统排期的平衡艺术

在Day 56的跨部门协同模拟中,IT负责人往往被误认为是最容易扮演的角色

很多人以为,IT负责人就是说一句:「技术上可以实现,但需要6个月。」

但真相是:IT负责人是整个项目中最难当的角色之一。

为什么?

因为IT负责人需要同时平衡四个看似矛盾的要求

  1. 业务方说:「我要的越快越好。」
  2. 技术团队说:「我们已经忙不过来了。」
  3. 财务部说:「这个预算太高了。」
  4. 老板说:「为什么IT项目总是延期?」

💔 一个IT总监的真实一周

让我们走进某造车新势力IT总监李明的一周(2024年9月2日-6日)。

周一早上:突如其来的“紧急项目”

李明刚到办公室,售后总监就找到他:

售后总监:「李总,我们要做一个智能预约系统,这个是老板亲自点名的项目,需要在今年Q4上线。技术上能实现吗?」

李明:「能说说具体需求吗?」

售后总监:「就是让客户能在手机APP上预约售后服务,系统自动分配门店和时间,AI智能诊断,等等。详细需求我这周给你。你先告诉我能不能做,需要多久?」

李明心里叫苦:「又来了一个‘需求不明确、时间很紧急’的项目。」

但他不能直接拒绝,因为:

  • 这是老板点名的项目
  • 业务部门正在等他的回复
  • 如果说“不能做”,会被认为“不支持业务”

李明的回复

「方向上没问题,但我需要看到详细需求才能给出准确的开发周期。初步估计,如果功能复杂度中等,至少需要8-10个月。但我们现在有几个问题:

  1. 我们团队现在有CRM、ERP、数据中台三个大项目在并行
  1. 开发人员已经超负荷运转
  1. Q4上线的话,需要砍掉其他项目或者增加人手。」

售后总监:「8-10个月?那不是要到明年了?不行,老板说了今年必须上。你能不能压缩到6个月?」

李明感觉头疼欲裂。

周二下午:老板的“灵魂追问”

周二,老板召开了一个快速会议:

CEO:「李明,听说你们的CRM项目又延期了?这已经是第几次延期了?」

李明:「是的,主要是因为:

  1. 业务方中期改了需求,增加了20%的新功能
  1. 第三方接口对接比预期复杂,多花了1个月
  1. 核心开发人员离职,新人需要交接

我们预计再迟1个月可以上线。」

CEO:「每次都有原因,但每次都延期。你知道吗,业务部门现在对IT部门意见很大,他们觉得IT成了他们发展的瓶颈。你怎么看?」

李明:「我明白他们的情绪,但我们真的已经很努力了。我们团队过去3个月平均每天加班到2小时,周末也经常加班。但现在同时有太多项目在并行...」

CEO:「我不想听过程,我只想知道结果。你能确保下个月上线吗?」

李明:「我尽力。」

走出会议室,李明心情沉重。

周三晚上:技术团队的崩溃

周三晚上8点,李明正在加班,突然收到一封邮件:

邮件主题:离职申请

发件人:张华(核心开发,团队里的技术骨干)

邮件内容:「李总,很抱歉在这个时候提离职。但我真的坚持不下去了。过去6个月,我几乎每天都在加班到晚上10点以后,周末也经常被叫到公司解决线上问题。我的身体已经出现问题,医生说我再这样下去可能会有心血管问题。我需要休息。」

李明看完邮件,感觉天旋地转。

这已经是他今年第5个离职的核心开发了。

离职原因都是一样的:长期超负荷工作,身体和家庭无法承受。

周四上午:与业务方的“翻译工作”

周四,销售总监找到李明:

销售总监:「李总,我们需要在门店系统里加一个功能,就是客户进店的时候,系统能自动识别他是老客户还是新客户,然后推送他的信息给销售顾问。很简单,就是一个弹窗。你们能不能快速开发一下?」

李明听完,开始“翻译”:

李明:「这个需求听起来简单,但实际上比较复杂:

  1. 身份识别:是通过什么方式识别?手机号、车牌id,还是人脸识别?如果是人脸识别,需要在每个门店装摄像头,这涉及硬件采购和隐私政策
  1. 数据打通:需要把CRM系统、DMS系统、会员系统的数据打通,这涉及数据中台改造
  1. 实时推送:需要建立实时消息推送机制,这对系统性能有要求
  1. 隐私合规:客户数据的使用需要客户授权,需要法务部门审核

初步估计,这个项目需要2-3个月。」

销售总监:「2-3个月?那么久?我看别的公司都有这个功能,应该很常见吧?你们能不能加快速度?」

李明:「别的公司可能他们的系统架构本身就支持,但我们的系统是5年前建的,当时没有考虑这个场景。现在要加,需要改底层架构。如果你们特别紧急,我们可以先做一个简化版,只通过手机号识别,1个月可以上线。但功能会弱一些。」

销售总监:「那就先做简化版,快速上线。」

李明又多了一个项目。

周五下午:一个不眠之夜

周五晚上9点,李明刚躁在沙发上想休息一下,电话响了。

运维经理:「李总,不好了!CRM系统崩了!全国所有门店都登不上去!」

李明:「什么情况?」

运维经理:「刚才发布了一个小版本,结果数据库连接池出现问题,导致系统崩溃。现在正在紧急回滚。」

李明:「发布前没有在测试环境充分测试吗?」

运维经理:「测试了,但测试环境的数据量和生产环境不一样,没有模拟出高并发场景。」

李明立刻冲到公司,和团队一起加班到凌晨2点,才修复了问题。

第二天,他收到了老板的邮件:「昨晚的事故影响了业务运营,请书面说明原因和改进措施。」

🔍 IT负责人的四重夹击

通过李明的一周,我们可以看到IT负责人面临的四重夹击

夹击1:需求与资源 - 业务想要的太多,技术能给的太少

业务方的视角

  • 「这个功能别人都有,为什么我们没有?」
  • 「这个需求很简单呀,就是加一个按钮。」
  • 「我们竞争对手1个月就上线了,为什么我们需要3个月?」

技术团队的现实

  • 每个需求看起来都很简单,但加起来是巨大的工作量
  • 现有系统架构老旧,每次增加新功能都需要大量改造
  • 人员有限,同时并行的项目太多
  • 技术债务积累,系统稳定性嶌嶌可危

真实案例:一个“简单需求”的真相

2023年5月,某自主品牌业务部门提了一个「简单需求」:

「在门店工单系统里,增加一个‘客户满意度评价’功能。就是客户服务完成后,系统发个短信给客户,让他们点5星。很简单,就和淘宝评价一样。」

IT负责人王强的分析

「这个需求表面上看起来很简单,但实际上涉及:

阶段1:短信发送

  • 需要对接第三方短信服务商API
  • 需要设计短信模板,考虑不同场景
  • 需要处理发送失败的重试机制
  • 工作量:3人天

阶段2:评价页面

  • 需要设计H5评价页面(支持25星+文字评价)
  • 需要适配各种手机型号和浏览器
  • 需要防刷机制(同一客户只能评价1次)
  • 工作量:5人天

阶段3:数据存储

  • 需要设计数据库表结构
  • 需要考虑数据备份和恢复
  • 需要设计索引优化查询性能
  • 工作量:2人天

阶段4:数据统计和展示

  • 需要开发后台统计页面(按门店、按技师、按时间的多维分析)
  • 需要实时计算NPS得分
  • 需要生成各种报表
  • 工作量:8人天

阶段5:与现有系统集成

  • 需要从工单系统获取客户手机号
  • 需要从客户系统获取客户基本信息
  • 需要将评价结果同步到CRM系统
  • 工作量:5人天

阶段6:测试

  • 功能测试:测试各种场景和边界条件
  • 性能测试:模拟高并发场景
  • 容灾测试:模拟网络故障、数据库故障等
  • 工作量:10人天

总计:33人天,约3个人做2周。

而且这还没有算上:

  • 需求沟通和确认的时间
  • 项目管理和文档编写的时间
  • 上线后的运维支持时间」

业务方的反应

「这么复杂?我看淘宝的评价功能很简单呀。你们能不能先做一个最简单的版本?就是发短信+收集评价,其他功能后面再加。」

王强的回应

「可以,但最简单的版本也需要至少15人天,约1周时间。而且后续如果要加功能,可能需要推倒重做。」

最终结果

这个「简单需求」整整做了5周,中间还经历了2次大改版。

这个案例告诉我们:IT负责人需要帮助业务方理解,看起来简单的需求,背后的技术实现可能非常复杂。

夹击2:时间与质量 - 业务要快,技术要稳

业务方的诉求

  • 「市场机会转瞬即逝,我们必须快速上线。」
  • 「竞争对手已经有了,我们不能落后。」
  • 「先上线再说,有问题再修。」

IT的担忧

  • 「如果为了赶时间而缩减测试,上线后出问题怎么办?」
  • 「系统不稳定会影响用户体验,最终损害的还是业务。」
  • 「每次“快速上线”都留下技术债务,累积到一定程度系统就会崩溃。」

真实案例:一次“快速上线”的惨痛代价

2022年11月,某新能源车企要赶在「双11」之前上线一个「秒杀活动」功能。

时间线

  • 10月20日:业务方提出需求
  • 10月25日:IT评估后给出方案,需要3周开发+1周测试
  • 10月26日:业务方坚持要求必须11月10日上线(还有15天)

IT总监张强的决策

张强知道这是老板重点关注的项目,不能拒绝。他让团队**“加速开发”**:

  1. 减少测试时间:从1周压缩到3天
  2. 简化功能:去掉一些「不重要」的细节
  3. 增加人力:从其他项目抽调2个开发
  4. 全员加班:包括周末

11月9日晚上11点,系统终于上线了。

11月11日早上0点,秒杀活动正式开始。

11月11日早上0点05分,灾难发生了:

  1. 系统崩溃:并发量超出预期10倍,数据库直接拒绝服务
  2. 订单丢失:部分客户支付成功但订单没有生成
  3. 重复扣款:部分客户被重复扣款2-3次
  4. 退款失败:退款机制没有充分测试,部分退款失败

后果

  • 紧急停止活动,修复系统
  • 人工处理超过3000个问题订单
  • 赔偿客户损失约200万元
  • 公司声誉受损,社交媒体上大量负面评论
  • 张强被问责,取消年终奖

事后复盘

主要问题:

  1. 性能测试不足:没有充分模拟高并发场景
  2. 事务处理缺陷:支付和订单生成没有在同一事务里,导致数据不一致
  3. 错误处理机制缺失:异常情况下的容错和退款机制没有完善
  4. 监控告警不足:系统出现问题后没有立即告警

这些问题,如果给具1周的测试时间,都能发现和解决。

张强事后反思

「这次事故给我最大的教训就是:不能为了赶时间而牺牲质量。技术上,有些时间是不能压缩的,比如测试。如果业务方坚持要求赶时间,我不能单纯地妖协,而要明确告诉他们风险,让他们自己决策是否接受这个风险。」

这个案例告诉我们:IT负责人必须在速度和质量之间找到平衡,不能为了迎合业务而置风险于不顾。

夹击3:创新与稳定 - 业务要新,系统要稳

业务方的期待

  • 「我们要用最新的AI技术,让产品更智能。」
  • 「竞争对手都在用大模型,我们也要。」
  • 「这个新技术很火,我们要立刻应用。」

IT的顾虑

  • 「新技术还不成熟,生产环境使用有风险。」
  • 「我们现有系统还有很多稳定性问题没解决。」
  • 「每引入一个新技术,都会增加系统复杂度和维护成本。」

真实案例:一次AI应用的“翻车”

2024年3月,某豪华品牌决定在客服系统中引入大语言模型(LLM,Large Language Model),实现智能客服。

项目背景

  • 老板在一次行业峰会上看到ChatGPT演示,非常震撼
  • 立即要求IT部门在公司产品中应用
  • 目标:3个月内上线,替代50%的人工客服

IT总监李佳的决策

李佳知道这是老板的「一号工程」,不能拒绝。但他也知道风险很大:

  1. 技术风险:LLM的输出不可控,可能会给
未经允许不得转载:似水流年 » Day 56-5:IT负责人视角 - 技术可行性与系统排期的平衡艺术