滴滴开放 AI 打车之后,我最想问的不是技术,而是这产品到底成不成立
滴滴开放 didi-ride-skill 之后,真正值得拆的不是技术接入,而是这件事作为产品到底成不成立。
滴滴把 didi-ride-skill 放出来之后,很多人的第一反应大概都是:AI 终于也能打车了。
但说实话,如果讨论只停在这里,我觉得有点浅。
因为这件事真正有意思的地方,不是“又多了一个能调用的工具”,而是它第一次把 AI 助手往一个特别现实、也特别容易翻车的产品场景里推了一步。
打车不是写诗,不是陪聊,也不是查资料。
它是一个目标非常明确、结果非常具体、用户容错率也非常低的场景。
你叫错车、叫错时间、叫错地点,用户不会觉得“模型偶尔犯错也正常”,只会转头把 App 打开,自己下单。
所以我更想从产品经理的角度拆这件事,而不是把它当成一条技术新闻看。
这篇主要讲三件事:
- 这个 Skill 解决的到底是不是一个真实需求
- 它的产品关键路径在哪里
- 为什么“一句话叫车”听起来简单,落地却不轻松
先看需求:它解决的是不是一个真问题
先说结论:我认为这是一个很成立的方向,而且是少数一眼就能看出价值的 AI 入口。
原因也不复杂。
打车本来就是一个高频、低决策成本、强时效的任务。
大多数时候,用户不是想“使用滴滴”,而是想尽快完成一件事:
- 去公司
- 去机场
- 去约定地点
- 查一下司机到哪了
- 预约明天的行程
这类任务最大的特点就是,目标明确,路径越短越好。
这也是为什么“对话式入口”在打车场景里有天然吸引力。
用户未必在乎背后是不是 AI,他在乎的是能不能少点几步,少切一个 App,少输一遍地址。
从这个角度看,滴滴开放 Skill,切的不是“地图问答”那种泛信息需求,而是“我现在就要出发”这种强执行需求。
它开放的其实不是一个接口,而是一条服务链路
按照目前公开的信息,滴滴这次开放出来的不是单点能力,而是一整套围绕打车流程组织过的服务能力。
站在产品侧看,这意味着它开放的不是一个按钮,而是一条完整链路。
| 能力 | 实际作用 |
|---|---|
| 即时打车 | 用户给出出发地和目的地后,助手可以发起预估和下单流程 |
| 预约出行 | 支持“10 分钟后出发”“明天早上 8 点去机场”这类时间表达 |
| 订单跟踪 | 下单后继续查询司机位置、接驾进度、订单状态 |
| 地址理解 | 处理“回家”“公司”“南门那个万达”这类不那么标准的地点表达 |
| 周边搜索 | 先找目的地,再衔接到打车动作,比如先搜附近门店再过去 |
| 个性化偏好 | 结合常用地址、车型偏好等信息减少重复确认 |
这里真正值得看的是,它把一条原本在 App 内完成的服务链路,搬到了 AI 对话里。
如果只是开放一个“创建订单”的接口,其实产品价值没那么大。
因为用户在真正下单前,往往还要先完成几个动作:说清楚去哪、什么时候走、选什么车型、价格大概多少、现在要不要下单。
这些动作没接住,所谓“AI 打车”就只是把表单换了个入口。
从产品路径看,核心不是下单,而是缩短任务完成链路
如果用产品经理最熟悉的视角来看,这个 Skill 的核心目标其实只有一句话:
把“从产生出行意图到完成下单”的路径缩到最短。
传统 App 的路径通常是这样的:
- 打开 App
- 等待定位
- 输入目的地
- 选择车型
- 查看价格
- 确认下单
如果换成 AI 入口,理想状态是:
- 理解需求
- 补全参数
- 给出预估
- 请求确认
- 发起下单
- 持续跟踪
- 处理变化
产品上真正有意义的,不是把原来的 6 步机械替换成 7 段对话。
而是看它能不能在用户几乎不费脑的前提下,把必要参数补齐,再把确认成本压低。
这决定了它到底是一个“新入口”,还是一个“新负担”。
真正决定这件事能不能成的,是三个产品环节
如果我是这个能力的产品经理,我会重点盯下面三个环节。
1. 意图识别是不是够快
用户说“帮我叫个车去机场”,系统到底能不能立刻识别这是一个打车意图,而不是路线咨询、旅游推荐,或者日程提醒的前置问题。
对话入口的第一个门槛,从来不是功能有没有,而是识别是否足够准。如果第一步就判断错,后面路径越长,损耗越大。
2. 补参过程会不会把用户聊烦
打车不是填写调研问卷。用户要的是效率,不是沉浸式聊天。
所以补充信息这一步很考验产品设计。该问的一定要问,不该问的就不要问。能从历史地址拿到的,不要再让用户重复输入。能通过上下文推断的,也别一轮一轮确认。
3. 确认节点要不要收得更克制
涉及真实下单的场景,确认一定要有,但确认太多也会把体验打碎。
最理想的状态不是“每一步都问你一遍”,而是把确认压缩到临门一脚。比如在价格、时间、车型都明确后,给用户一个清晰的确认摘要,然后一次性完成操作。
如果这件事做好了,体验应该是什么样
如果这套 Skill 最终真的要形成稳定体验,我觉得对话应该接近下面这种状态:
我:明天早上 6 点半帮我叫车去虹桥机场
助手:从哪个地址出发?你常用地址里有“家”和“公司”
我:从家走
助手:明天 6:30 从家到虹桥机场,快车预估 78 到 95 元,预计 42 分钟。要帮你预约吗?
我:要
助手:已经预约成功,后续有司机接单我再提醒你
这段体验的价值不在于“像人聊天”,而在于它把用户最关心的几个节点都接住了:
- 只在必要的时候追问
- 快速给到可判断的信息
- 先预估,再确认
- 下单后还能继续服务,不是做完就结束
难点也很清楚:这个场景太容易翻车了
如果从产品落地看,这件事最难的地方不是“把接口接出来”,而是处理那些最容易让体验崩掉的边界场景。
比如这些情况都不算少见:
- 用户说“去国贸”,但一个城市里可能不止一个“国贸”
- 用户说“现在叫车”,但定位权限、出发点、支付方式还没准备好
- 用户在下单后改口,说“算了,换成专车”
- 用户同时提到多件事,比如“先看看附近咖啡店,再叫车过去”
- 用户把打车和其他安排串在一起,比如“我 8 点有会,帮我算一下几点该出门”
这些问题看着像模型理解问题,实际上很多都是产品定义问题。
该不该自动推进,推进到哪一步该停,什么场景必须确认,什么场景允许默认,这些都需要明确规则。
换句话说,这不是一个“模型越聪明越好”的问题,而是一个“产品边界划得准不准”的问题。
如果我是 PM,我会先盯这几个指标
如果我是产品经理,我不会先盯“用户觉得酷不酷”,我会先看几个更硬的指标:
- 意图识别成功率
- 从用户首次表达,到完成下单的平均轮次
- 因地址歧义、时间歧义导致的中断率
- 下单前确认后的取消率
- 下单成功后的查单、跟踪使用率
这些指标合起来,基本就能看出这条链路到底顺不顺。
尤其是“平均轮次”这个指标,我会特别在意。
因为很多对话产品的问题不是不能完成任务,而是完成得太磨叽。
用户能接受 AI 帮他多想一步,但不太能接受它陪自己聊八轮天才把车叫上。
怎么使用
如果你想自己试,可以按现在公开的方式接入:
| |
相关链接
| 资源 | 地址 |
|---|---|
| 滴滴 MCP 官网 | https://mcp.didichuxing.com/ |
| ClawHub 安装 | https://clawhub.ai/didi/didi-ride-skill-official |
| 开源项目 | https://github.com/didi/didi-ride-skill |
还有一个容易被忽略的点:Skill 本身也是产品设计
从这个角度再回头看,Skill 这件事本身就不只是技术封装,它也是产品封装。
它其实在定义一件事:AI 助手在出行场景里应该管到哪,停在哪,什么时候代办,什么时候只辅助。
这比单纯开放几个 API 更重要。因为真正决定体验的,不是能力列表,而是产品怎么把这些能力编排进用户旅程。
最后说我的判断
如果从产品经理视角总结,我会觉得滴滴这次开放打车 Skill 值得看,不是因为它证明了 AI 多先进,而是因为它选了一个特别适合检验产品能力的场景。
这个场景用户需求明确,路径短,价值感知强,错误成本也真实存在。
做得好,用户会很快形成习惯。
做不好,用户也会毫不犹豫退回原来的 App 路径。
所以它的价值不在“一句话叫车”这句宣传语本身。
真正值得看的,是它有没有机会把“出行意图到下单完成”这条路径,真的重新设计一遍。
本文基于滴滴出行公开发布信息整理与延伸分析。