
1. 为什么AI产品的用户体验总是一团糟我做了十多年产品设计最近五年又在捣鼓AI系统。我既能在Figma里画组件也能在后端把驱动它的智能体给搭起来。说实话能把这两件事都整明白的人少得可怜。而这恰恰是今天绝大多数AI产品用起来让人抓狂的根源。问题不在于AI本身不够聪明——很多时候模型已经足够强大——而在于从构思到落地的整个过程中那个既懂AI技术原理、又懂交互设计的人压根就不在房间里。这可不是什么小毛病。你随便打开一个主要由机器学习工程师主导开发的AI产品不出30秒那种别扭感就会扑面而来。理解Transformer工作原理的人他们的思维模式是损失函数和基准测试分数而不是用户的操作流程。所以当一个ML工程师来设计界面时你大概率会得到一个布满40个滑块的设置面板以及一句“控制模型输出的随机性”的提示。谢谢这真是太有用了。另一方面精通交互设计的人往往又无法亲手实现AI系统。他们能画出精美的用户旅程图却可能不知道“上下文窗口”是什么无法权衡延迟的利弊只能把AI当作一个要么行、要么不行的黑盒子。这个交集——能同时驾驭两端的人——实在太小了。结果就是大多数AI产品都是由其中一方单干出来的缺陷一目了然。一个残酷的事实是一个体验出色的平庸模型几乎每次都能打败一个体验糟糕的顶尖模型。ChatGPT最初的成功并不是因为GPT-4在当时所向披靡而是因为它那个聊天界面简单到极致你输入它回复。没有复杂的配置没有冗长的引导更不需要你去理解什么是“温度”参数。那个聊天框是一个纯粹的设计决策而非技术决策而它价值数十亿。2. AI用户体验失败的六大具体症候说“用户体验差”太笼统了我们需要拆开来看。在我深度使用各类AI产品的过程中以下六个问题是反复出现的顽疾。2.1 “万物皆可聊天”综合征并非所有的AI交互都需要一个文本输入框。有些场景需要一个按钮有些需要一个滑块一个标注清晰的滑块有些则是一个下拉选择菜单。仅仅因为“聊天”模式容易实现就把它作为万能UI实质上是把本该由产品完成的工作——让正确的操作显而易见——甩给了用户。这完全是本末倒置。如果你的AI能总结文档那就放一个“总结”按钮。别让我像填写1998年的网页表单一样去输入“请总结这份文档”。聊天界面模式被盲目模仿只是因为ChatGPT这么做了并且成功了。但ChatGPT的核心就是对话它是一个通用助手。而大多数AI产品并非通用它们是为特定工作流程解决特定问题的。一个专注的工具理应有一个专注的用户界面。强迫所有功能都通过“对话”来触发是对用户认知负荷的极大浪费。2.2 让用户以为程序崩溃的加载状态生成式AI就是慢。一个响应可能从1秒到25秒不等这取决于模型、提示词长度和生成内容。用户无法忍受一个孤零零的旋转图标转上20秒。他们需要知道事情正在发生大概还要多久以及如果可能的话最好能预览到正在流式输出的内容。在2025年的今天流式输出已经是及格线。如果你的AI产品展示一片空白然后突然“哐当”一下吐出完整结果那你就已经输了。这感觉就像是应用卡死了然后又神奇地恢复了。流式输出能让实际等待时间在感知上变短——这不是什么小花招而是对用户注意力的基本尊重。我见过一些产品在进行一个15秒的模型调用时只显示一个静态的旋转图标没有任何文字说明没有进度提示什么都没有。用户绝对会去点刷新然后对着重复的输出结果感到困惑。这明明是一个早已被解决的UX问题却因为负责AI部分的工程师觉得“UI够用了”而被一再忽视。2.3 写给工程师看的错误信息“出了点问题。” “超出速率限制。” “上下文长度超限。” “模型不可用。” 这些都是用户经常会碰到的真实错误但它们都不应该以这种生硬的、技术性的状态呈现给用户。当模型触发速率限制时应该告诉用户“当前需求旺盛我们正在重试”。当上下文过长时应该用平实的语言告诉他们该怎么做而不是提什么“令牌数”。比如“对话有点长了尝试开始一个新对话以获得最佳效果。” 错误处理是检验设计师是否真正参与其中的试金石。工程师写的错误信息是给自己看的设计师写的错误信息是给那个只想完成任务的人看的。前者指向原因后者指向解决方案。2.4 为“无人”设计的设置页面温度Temperature、Top-p、频率惩罚Frequency penalty、存在惩罚Presence penalty、最大令牌数Max tokens……这些设置之所以存在是因为它们是API的参数。它们被暴露在UI上往往只是因为没人问“我们应该暴露这个吗”而只问了“我们能暴露这个吗”是的你能暴露它但这不意味着你应该。我理解高级用户有时需要控制感。但默认值应该是隐形的高级设置应该藏在一个“配置”链接后面让95%的用户永远不需要点击。渐进式呈现是一个基本的设计理念先展示简单的东西把复杂的东西放在多一次点击之后。当你的设置页面看起来像一台合成器的控制面板时设计就已经失败了。用户不想去“调教”一个模型他们只是想完成某件事。2.5 将AI输出视为最终结果AI的输出永远是一个草稿始终都是。最好的AI产品会通过支持就地编辑来明确这一点点击一个句子修改它。系统知道你修改了并以此作为反馈信号。当AI的输出以静态、只读文本块的形式呈现时你就在无形中告诉用户AI的话是最终裁定。这又搞反了。用户才是主导者AI是协作者。用户界面应该让编辑、重新生成或拒绝任何一段输出变得极其容易。Linear的AI总结功能就是一个正面例子总结内容直接内嵌在上下文中你可以像编辑任何其他文本一样修改它。AI提供了一个起点但结果由你掌控。这种设计哲学将AI定位为辅助工具而非权威来源极大地提升了用户的控制感和最终产出的质量。2.6 缺失的反馈闭环如果用户删除了AI的输出并输入了完全不同的内容这是一个信号。如果他们重新生成了三次这是一个信号。如果他们总是忽略建议的操作这还是一个信号。然而大多数AI产品根本没有收集这些信号至少没有主动收集。没有“赞/踩”没有“修复此问题”按钮用户无法告诉系统“你这里搞错了。”除了对产品改进的价值反馈UI本身能让用户感受到掌控力。AI不是在“对”他们做什么而是在与他们“协作”。这会从根本上改变产品的使用感受而实现它的成本几乎为零。尼尔森诺曼集团对此有大量研究内置反馈机制的产品其用户满意度 consistently 高于那些将AI输出视为单向广播的产品。这不是什么新见解却总被跳过。3. 优秀AI用户体验的本质与案例好的AI用户体验是隐形的。AI在那里工作但你几乎察觉不到它。你只会觉得这个产品用起来顺手得超乎预期。自动补全能预测你真正想输入的内容智能默认值会根据你之前的操作进行调整错误在你看到之前就自我修正了建议会在合适的时机、合适的上下文中在你提出要求之前就出现。目标从来不是炫耀AI。目标是让用户感到自己能力出众。用户说“这个工具真直观”和说“哇这个AI太神奇了”有本质区别。前者代表好的UX后者通常意味着AI令人印象深刻但UX仍然让你意识到了它的存在——这说明它还在碍事。Figma的AI集成值得关注因为Figma的团队真的懂设计。他们仍在努力让AI操作感觉更可预测——总会有那么一个“等等它刚才做了什么”的瞬间——但他们比大多数团队都更接近目标。那个令人困惑的瞬间正是他们正在积极偿还的UX债务。目前我真正喜欢用的产品有Notion AI因其流畅的上下文编辑流程、Cursor因为它让AI建议感觉像协作者而非替代者以及Linear因为它将AI功能置于关键路径之外只增强而不阻塞工作。这三者有一个共同点AI是环境式的Ambient。它在你需要时出现不需要时隐去你永远不需要为了使用它而去理解它。4. 糟糕的AI用户体验为何仍能大行其道这个鸿沟并未快速弥合。AI能力每隔几个月就跃升一次而设计却被视为可选项或者“我们以后再优化”。结果就是我们拥有一个由日益强大、却被包裹在日益令人困惑的界面中的AI所构成的生态系统。这在一定程度上是结构性问题。大多数AI公司由研究员或工程师创立设计师的招聘往往滞后甚至根本没有。而当设计师终于加入时他们常常发现自己所在的团队中ML工程师早已做出了根本性的UX决策——只是他们没把这叫做“设计决策”。系统的架构变成了界面的架构而这几乎从来都不是正确的做法。谷歌的“人AI研究”PAIR团队对此有一整套指南即使你不完全认同其中的所有内容也值得一读。其核心洞察——AI系统需要一种与确定性软件根本不同的设计方法——是正确的。你不能简单地将标准UX模式套用在一个每次都可能给出不同答案的系统上。如何处理不确定性、如何传达置信度、如何让AI操作感觉可预测又不死板……这些才是困难的设计工作而大多数团队都跳过了。Anthropic的模型卡片和使用政策文档也提供了一个有用的视角。他们思考Claude应如何沟通不确定性和局限性的方式本质上是在模型层面应用UX思维。这很罕见。大多数模型提供商将界面层视为别人的问题。那些想明白这一点——真正雇佣能横跨两个领域的人才或者在ML和设计团队之间建立真正协作的公司——将会大获全胜。不是因为他们的AI更好而是因为他们的AI用起来合乎常理。5. 给AI产品建造者的行动指南先修UX再调模型如果你正在构建AI产品当下杠杆率最高的一件事不是升级你的模型而是找五个用户在不提供任何帮助的情况下观察他们如何使用你的产品。不要说话只是观察。你会清晰地看到AI能力终止而用户困惑开始的那个临界点。那就是你的设计债务。花一周时间解决这些问题然后再去折腾你的提示词工程或微调流水线。UX问题正在让你流失的用户远比模型质量问题造成的流失要多。用户体验的缺陷直接阻碍了用户价值的实现而一个流畅的交互能极大弥补模型能力的微小不足。这种先优化体验再深挖技术的顺序能确保技术投入真正服务于用户可感知的改进。从更根本的层面看要打破这种僵局需要两种思维的深度融合。技术团队需要培养“产品感”在思考损失函数时也思考这个参数调整会如何影响用户的第一印象和操作流程。设计团队则需要主动学习AI的基本概念理解上下文窗口、令牌、延迟、置信度这些术语才能与工程师在同一个频道对话提出技术上可行、体验上优秀的方案。这可能意味着在团队中引入“AI产品设计师”或“UX工程师”这样的混合角色或者建立固定的、深入的跨职能评审机制让设计评审会和技术架构会不再是各自为政的孤岛。最终衡量AI产品成功的标准不应仅仅是基准测试的分数更应是用户完成任务的速度、准确度和愉悦感。当用户不再感叹“AI真厉害”而是自然而然地说“这个功能真好用”时我们才真正跨越了技术与人性化体验之间的鸿沟。这条路没有捷径它始于对真实用户困境的细致观察并终于对每个交互细节的执着打磨。模型会自己变得越来越好但优秀的用户体验不会自动发生它需要我们刻意地去设计、去建造。