AI 应用，Web 优先？

April 13, 2024

在 X / Twitter 上读到这样一句话：

Note: AI is web-first.

话虽短，但是很有力，也和我最近观察和思考到的现象比较一致。在 Web 上涌现出了大量的 AI 应用创新，不管是以独立网站还是以浏览器插件的形式存在。相反，App Store 上所谓的 AI 产品榜单基本上还是那几样：ChatGPT 加上一些之前就存在的产品的 AI 增强版。

这不是偶然的。我相信这个现象还将持续一段时间，背后有它的原因。

开放，无需许可

首先介绍一个概念：协议网络 protocol network，它在 Chris Dixon 1 月份出版的新书 Read Write Own 作为主导性的概念提出来，书中给出的定义是：

协议网络：如电子邮件和互联网，是由软件开发人员社区和其他网络利益相关者控制的开放系统。这些网络是平等的、民主的和无需许可的：对任何人开放并可免费访问。在这些系统中，金钱和权力往往流向网络边缘，激励系统围绕它们发展。

与之相对的概念是：企业网络 corporate network。

企业网络：由公司而不是社区拥有和控制的网络。这些网络就像一个有围墙的花园，只有一个园丁；它们是由一家大公司控制的主题公园。企业网络运行集中的、许可的服务，使他们能够快速开发高级功能、吸引投资并累积利润以再投资于增长。在这些系统中，金钱和权力流向网络中心，流向拥有网络的公司，远离网络边缘的用户和开发者。

Web 是一个典型的协议网络，没有单一中心化节点控制整个网络，也没有谁能从中赚取 take rate。App Store 则是一个典型的企业网络，Apple 等少数中心化节点控制整个网络，并且从中收取高昂的 take rate。常见的协议网络也包括 Email 和 RSS，后者已经几乎从大众视野中消失了，但前者仍然在被广泛使用。

协议网络的一个重要特点就是 permission-less（无需许可）。在 Web 上，你基本上不需要什么许可就可以开设新的网站，也就是在网络中建立新的节点。多年以来，Web 技术栈越来越丰富和多样，大量的开源组件不断涌现，建站成本大幅下降，而网站能做的事情却越来越多。

围绕 AI，开始出现了很多面向开发者的工具 / 中间层，比如 Langchain、Cohere、Vercel AI SDK 等等。即便是面向 C 端发布的 Perplexity 和 Brave Search 也开放了自己的 API 供有能力的用户在三方场景调用。

构建一个网络的收益很大，而初始投入也很大。企业网络往往建立在协议网络之上，作为自己冷启动的杠杆。搜索引擎和社交媒体本来都是互联网上的节点，后来他们有了一定规模之后，形成了各自的闭环。你可以用浏览器打开微信公众号的文章，但却必须用微信扫码才能关注这个号。这是一种常见的利用协议网络来做企业网络增长的办法。

协议网络的 permission-less 特性对于创新者而言具有极强的吸引力，它的研发实现成本更低，也容易做初始推广。AI 技术的应用仍然处于早期采纳的阶段，需要大量的迭代试错，Web 很适合快速发布这些尝试。反过来看，很多人也会利用搜索引擎和社交媒体这些企业网络来为自己的应用获取免费流量。

相比之下，App Stores 都是封闭花园（Closed Gardens），它牺牲了大量的开放性，需要满足特定规范，经过企业的审核才能完成发布，进入到企业网络或者封闭花园中去。这些牺牲一定程度上换取了用户体验的改善，比如 iOS Apps 对于应用内支付接口的统一管理，避免了大量不必要的金融风险。Apple 也因此可以收取 30% 的分成费用——相比之下，Web 上的支付费率要低很多。

由于 App Store 的封闭性，它缺乏 Web 上那么活跃的开源社区，Apple 和 Google 希望通过一己之力降低开发者的成本，但收效有限。Apps 本身是二进制的，需要编译后才能完成发布，这样的开发者体验也阻碍了产品的快速迭代。一般而言，Apps 每周发布一个新版本已经算是较为频繁的更新，但 Web 则可能每天都发布多次微小的改进。

这样的节奏显然不适合创新者们进行试错。同时，Apps 更多面对的是主流用户，而非愿意尝鲜的早期采纳者（early adopters），这其实也是一种隐含的错配。尝鲜者希望更快的收到更新，但在 App Store 的封闭花园中，这一点无法满足。

离数据源更近的天然倾向

开放性使得互联网成为 AI 模型训练最大的数据来源。但这远远不够，AI 应用还需要使用大量的个人数据，这些数据分散在不同的网络中，办公软件、笔记、聊天等等。AI 应用天然想要和这些数据更近。

用户会希望 AI 应用能够更方便的连接或调用自己过去所积累的数据，而不是从头开始教 AI 学习自己的习惯。Web 的开放生态会比 App 的封闭生态更好，开发者很容易抓取 Web 页面上的数据，也就更容易连接到用户的个人历史，更快的完成初始学习的步骤。

网页浏览器（Web Browser）是在 OS 之上最重要的软件，因为只有它能打开 Web 上丰富多彩的内容和数据。除了公开可获取的内容之外，还有大量的私人数据，也以网页的形式存在，比如企业文档、个人笔记、学术讨论等。出于隐私、法律等限制，这些数据难以成为 LLM 训练的语料，但却可以在特定场景下成为模型推理的输入。Arc 提出的 a browser that browses for you 的理念很可能会重新定义浏览器和其浏览的 Web 内容的关系：浏览器不仅仅只是读取数据、渲染内容的「容器」，而是会尝试理解、连接和组织内容，更加完整和直接的把解决方案带到你面前。

这与 Chrome 的哲学大不相同：Chrome 意味着极简主义和极致性能，它在 Web 的上下文中，仅仅是用户界面的框架和边界，它不希望自己过多的干预内容。这种实用而克制的设计是在 Web 应用的配合下共同完成用户的任务的：你需要去 Google、Gmail、YouTube 等网站上解决不同的问题，Chrome 负责用最快的速度带你到达目的地，问题如何解决，是你自己的事情。

Chrome 从 Firefox 那里学来了扩展插件（extensions）功能，并对扩展开放了很大的访问权限，这就为 AI 应用提供了无穷无尽的输入。对网页内容进行总结或翻译，对搜索结果进行总结，或者针对特定网站比如 YouTube、Amazon 提供特定服务，都是很好的策略。这个生态的规模在 2020 年前后增长一度停滞，随着 AI 应用的爆发，很多开发者意识到，这是一个绝佳的创业机会。

一种寻找创新方向的方法是：用户的数据存储在哪？特别是那些数量庞大、缺乏良好结构化组织的数据。这些个人数据经过 AI 的学习和组织，很可能会为用户创造出新的价值。很多时候，用户的 jobs to be done 就是要在历史数据中通过连接散点来定义价值。微软的 Copilot 架在 Office 文档上，Notion AI 架在用户的笔记和数据库上，Shortwave 架在用户的 Emai 上，Arc 架在用户浏览的网页上 ... 由数据源头开始，推演可能的用户场景。如果我们分析用户的 Documents 文件夹中都有哪些类型的文档，或许能得到不少有用的结论。

不难发现，这其中大量的场景会和生产力相关：数据就是从生产力场景中产生出来的。

Web-first 并不意味着 AI 应用最终都会是 Web 应用，移动应用、硬件或者还有其它难以想象的形式。用户只想完成他们的 jobs to be done，而不在乎你用了什么锤子。对于创新者和投资人而言，避免惯性思维很重要，否则很容易被上一个时代的产品形态所局限。

← Back to Newsletter Archive