
配套视频:https://www.bilibili.com/video/BV1wXEM6yEcV/
引言:一场关于"下一个界面"的思考
如果你正在午餐前听完这场演讲,那它一定值得你等待。
回到 2022 年 11 月,那时我们与 AI 交互的方式极为原始——打开 ChatGPT,输入提示词,让它生成一段组件代码,然后手动复制、粘贴、调整格式,反复折腾。我把这种方式称为**"平民版字节编码"**。尽管如此,它确实奏效了,令人兴奋——你居然能让模型帮你构建一些 UI!
然而,短短三年后的今天,事情已经发生了根本性的改变。
一、惊人的拐点
2025 年末,两款模型的发布带来了一个载入史册的技术拐点:GPT-5.2 与 Claude Opus 4.5。
它们不仅在大多数任务上表现出色,更在以下方面实现了质的飞跃:
✅ 擅长处理长时程任务
✅ 具备高保真 UI 生成能力
✅ 生成的 UI 质量高、可运行、有时极具创意
✅ 生成速度极快
我亲身体验了这一变化。我只用了一个简单的提示词:"重写我的博客",模型不仅完成了任务,还主动添加了一个带模糊动画效果、开箱即用无障碍功能的搜索框——这是我完全没有要求的。
就在那一刻,我意识到:从 ChatGPT 发布到今天,短短三年,AI 已经能写出比我更好的前端代码了。
我没有自我,这只是现实。
二、核心问题:为何仍停留在旧范式?
既然模型写 UI 代码已如此出色,为什么我们仍然困在以静态界面为主的旧范式中?那个"贾维斯时刻"——悬浮窗口随需出现、消失——为何迟迟未到?
当前,业界对"新电脑的界面是什么"这一问题,主要有两种探索方向:
方向一:聊天界面(Chat Everywhere)
几乎所有 SaaS 公司都在首页和产品中加入聊天功能。聊天并非最终形态,但目前可用。
方向二:超级应用(Super App)
以 ChatGPT、Claude、Gemini 为代表,通过 MCP 应用将第三方 UI 统一纳入一个智能体环境中交互。
这两条路都在探索中,消费者最终会告诉我们答案。但更本质的问题是:模型究竟在生成什么?
三、生成式 UI 的三个层级
🔹 第一层:静态组件(Static UI)
这是目前最主流的方式。
智能体作为编排者,通过工具调用(Tool Call)传递参数和数据,这些数据被映射到开发者预先定义好的静态组件,最终由客户端渲染呈现。
本质上,这与传统的"服务端返回数据 + 客户端渲染"并无太大差异,只是数据和参数由智能体生成。
代表工具:
AGUI 协议:提供 SDK,将客户端工具映射到 React 组件
Goose Auto Visualizer:自动匹配数据并映射到预设组件集合
🔸 第二层:声明式 UI(Declarative UI)
这是近期出现的进化形态,也是当前最佳平衡点。
与静态组件方式不同,智能体不再只是传递属性和数据,而是生成一份 JSON 或 YAML 描述符,再由翻译渲染引擎将其转换为最终 UI。
这种方式更加动态,也更具个性化——但仍然基于开发者预定义的组件和设计系统。
这其实并不新鲜。Netflix 很早就在做类似的事:当你打开 Netflix 首页,看到的是完全为你个性化定制的界面,但所有元素仍然来自 Netflix 的组件库。
代表工具:
Vercel JSON Render:支持 JSON 和 YAML 映射组件,创建高度动态的 UI 交互
为何说它是当前最佳平衡点?
🔺 第三层:生成式组件(Generative Components)
这是下一个层级,也是最令人兴奋、同时最具挑战性的方向。
既然模型擅长编写 React、JavaScript 和 CSS,为什么不让它们在运行时直接按需生成代码?
我做了一个实验:创建了一个天气智能体,它调用天气 API,同时生成笑话、HTML、CSS 和 JavaScript,全部在一次工具调用中完成,并即时呈现给用户——一个完全由智能体创作的、随机但极具创意的 UI,没有任何预定义组件。
但这里有一个核心问题:安全性。
我们不信任未经审查的第三方代码,同样,我们也不应该信任由 LLM 直接生成并呈现给用户的代码。生成式 UI 的这一层级,必须有边界、有约束、有沙箱隔离。
四、MCP 应用:生成式 UI 的最佳交付机制
这正是 MCP 应用的价值所在。MCP 应用是目前生成式 UI 最理想的交付机制,原因如下:
🔐 内置认证机制
🔗 UI 与智能体之间的通信与消息传递
🛠️ 工具调用支持
📦 双 iFrame 沙箱隔离,默认安全
🌐 同时适用于第三方 UI 和第一方 UI
值得关注的是,Anthropic 在为 Claude 开发可视化功能时,选择了 MCP 应用而非自建渲染架构。这一战略选择意味深长——如果 Anthropic 都选择 MCP 应用来交付第一方 UI,我们没有理由不这样做。
尤其是当 UI 由编码模型实时生成时,MCP 应用是目前最优的交付机制。
五、未来展望:超越组件,走向协作
我们仍处于早期。人们不断追问:聊天是最终形态吗?MCP 应用是最终形态吗?
答案是:我们还不知道,但我们的想象力可能还不够。
有一个类比非常贴切:20 世纪早期电视刚出现时,第一批电视节目只是"加了摄像机的广播节目"——因为当时的人们无法想象这种新媒介能做什么。今天,我们与 AI 的关系,正处于同样的"广播时代"。
我认为真正的未来方向是:人机协同(Human-Agent Collaboration)。
一个很好的案例是 Scaledraw MCP 应用:它创建了一个人与智能体共享的协作画布,你可以与智能体来回对话、提出修改,也可以像使用普通工具一样直接点击操作界面。这种共享成果空间,才是人机交互的新范式。
未来的生成式 UI 将具备两个核心特征:
🎯 高度个性化
🤝 真正可协作
结语
我们拥有了一台新电脑,但它的图形界面尚未被发明。就像 20 世纪 70 年代,一切都还只是文字终端——我们有了超级智能,却还没有成熟的交互语言。
用户交互的最终形态是什么?我们还不知道。
但我们可以塑造这个未来,打造这台新电脑。
如果这篇文章对你有帮助,欢迎点赞、收藏、转发。也欢迎在评论区分享你的经验,我们一起交流学习!
加入社区 与 小遥一起成长 ↓

#独立开发者 #AI编程 #个人开发者 #一人公司 #程序员 #软件开发者 #创业者 #数字游民 #AI创业 #软件工程