08.05.2024: 湾区游走，85 倍投资回报，1982 电脑开箱，AI 套壳应用

August 5, 2024

本周在湾区游走。这次来和上次不同的是，接触了更多的 founders（即便见了几个 investors 也往往是从 founder 转型过去的，自己做 fund 本身也是一个创业的过程），观察和交流的视角发生了很大的变化。有一些共同点，这里做个分享。

Notes

Pivots, Missions and Working Backwards from the Future

首先借一段 Mike Maples（Floodgate Fund 创始合伙人）的话：

What a great startup does is it backcasts, and it says "I have to start with the assumption that the future will be radically different" by definition, because if it's an outgrowth of the present, the incumbents have the advantage because they've defined the rules of the present. So what I need to do is imagine radically different futures and work backwards.

一家伟大的创业公司会进行回溯，它会说“我必须从未来将完全不同的假设开始”，因为如果它是现在的产物，那么现任者就会占据优势，因为他们已经定义了现在的规则。所以我需要做的是想象完全不同的未来，然后反向思考。

这段话来自于他在 The Logan Barllet Show 上接受的访谈。他最近出版的新书 Pattern Breakers: Why Some Startups Change The Future 就是围绕这个主题展开的。

在这个两个小时的访谈中，他有很多精彩的表述。其中一个例子是 Twitch：他投资 Twitch 的时候，Justin Kan 在做一个 24x7 的个人生活直播秀，后来 Justin Kan 开发了 Social Cam，以 6000 万美元卖给了 Autodesk，Maples 认为，这家公司也就这样了，甚至于把它从给 LP 的财务报表中拿掉了。而 Justin Kan 的第二个产品 Twitch 在 2014 年以 9.7 亿美元的价格卖给了 Amazon，Maples 才发现他的投资回报达到了 85 倍。Justin Kan 看到的是一个在带宽成本不断下降的背景下流媒体直播的未来，然后反向思考，从直播自己的生活开始，不断迭代探索，最终找到了 Twitch。

Maples 提到他的投资回报中，有八成都经历了类似的转型（Pivots）。我发现，我这次旅途中见到的朋友，很多也都经历了类似的转型。

之前在豌豆荚的美国同事，从中国回到美国，给自己放了一个 9 个月的假，去了很多地方旅行，学习潜水和禅修，后来去读了一个博士学位，现在在大学任教职。
成功创办基因检测公司的创始人，在公司呆了 6 年后，发现自己在重复自己，辞职后跑到台湾居住（也去学了潜水），学中文，然后发现自己希望能帮助更多的科学家创办企业，于是在疫情期间，从台湾远程开始合伙开搞孵化器，现在已经有了 20 几个 portfolio。
在 Berkeley 山上的 hackerhouse 做 start-up 的年轻创始人，大三从清华辍学，一张单程机票来到湾区，认准了想在美国做一个 AI 时代的微信，但现在的产品是一个帮助用户根据文件内容重新给文件起名字的 AI 应用。

有些人在生命的早期阶段就知道自己喜欢热爱的事情，有些人则是在与岁月成长的过程中发现的。无论是哪一种人，我始终认为，找到这样一件事情是重要的，暂且认为这就是一个人的 mission 吧。

Mission 和 Maples 讲到的 the assumption that the future will be radically different（未来将完全不同的假设）往往是一个硬币的两面。世界上真善美高大上的事情太多了，一个 make the world a better place 的 mission statement 显得含混不清，而人生的长度有限，能做的就那么多，现实的理想主义是：做出未来将如何不同的假设，然后推演出可能连接现在与未来的桥梁。

Obvious Ideas

Obvious ideas may not be obvious.

显而易见的想法并不真的显而易见。我们经常碰到一些想法，第一次听说的时候就感觉被击中了，会想到为什么我没有想出这样的一个想法？实际上，这些想法背后往往蕴藏着一些复杂的技术问题，大部分人没有想到这些想法，从是因为他们并不知道其中的复杂性，或者很简单的认为在技术上不可能实现，所以自己杀死了这些想法。

从想到，到做到，中间还有一个状态，就是想到怎么做。（来自 我的 Twitter）

这个思考来自于和另一个 founder 的对话。我第一次看到他的 demo video 就觉得这个想法太棒了，为什么如此显而易见的事情没有别的人想出来呢？我很快发现，这样的想法似乎有很多。但在和这个 founder 深入沟通之后发现，看起来显然的想法没有人做的原因是没有人真正细致深入的去思考，背后的工程怎么搞？用户场景中的痛点到底是什么？有没有办法赚钱？

如果细想，这些显然的想法立刻就不显然了——所谓的门槛低，上限高，深不可测。

Reads

The Legendary Mike Maples: What Makes Startups Win & The Future of Venture Capital by The Logan Bartlett Show

这是开篇时候提到的 Mike Maples 的访谈文字稿，从 YouTube 字幕整理而来。原访谈视频长达 2 个小时，所以这个文字稿也比较长。很多思考在前面也写了很多，不再展开。

这个访谈实际上是围绕 Pattern Breaker 这本书来讲的，我计划去读一下这本书。

Living With a Computer by James Fallows

这是一篇来自大西洋月刊刊登于 1982 年的文章，描述了作者从机械打字机换到个人电脑后，写作流程的一些变化。编选这篇文章的原因是：这些变化在 42 年后读来，颇有一种历史再现的感觉。

比如，早期的文字处理器（Word Processor）收到当时硬件限制，做多能处理的文档长度存在上限，像极了现在 LLM 的上下文窗口：

My computer has a 48K memory. Since each K represents 1,024 bytes of information—each byte representing one character or digit—the machine can manipulate more than 49,000 items of information at a time. In practice, after allowing for the space that The Electric Pencil's programming instructions occupy in the computer's memory, the machine can handle documents 6,500 to 7,500 words long, or a little longer than this article. I break anything longer into chunks or chapters and work with them one at a time.

我的计算机有 48K 内存。由于每个 K 代表 1,024 字节信息（每个字节代表一个字符或数字），因此该机器一次可以处理超过 49,000 条信息。实际上，在考虑到 Electric Pencil 的编程指令在计算机内存中占用的空间后，该机器可以处理长度为 6,500 到 7,500 字的文档，或者比这篇文章稍长一点。我会将任何较长的内容分成几部分或几章，然后一次处理一个。

再比如：系统打印速度是每秒 30 个字符，打印一页纸需要不到一分钟，作者会把文档打印出来后，用铅笔修改，然后再到电脑上完成修改，重新打印。在机械打印机上，他需要重新输入整个文档。作者认为，对于没有私人助理的人来讲，这是巨大的效率提升。

文字处理器在这个时间点上最重要的功能就是更简单的编辑修改，在时间节省上肯定有 10x 的效率改进。尽管计算机要比打字机贵 10x，但已经足以启动整个市场。关键在于是不是能帮助用户 10x 的改进效率。而计算机显然能做更多的事情，但只要有一个 10x use case 就已经足以撬动购买决策。

The system prints about thirty characters per second, which means it takes less than a minute per double-spaced page. When it has completed its work, I take the manuscript and start working it over with a pencil, just as I did in days of old. The difference is that after I've made my changes, I have only to type in the changes I have made and start the printer up again—rather than retype the whole mess.

系统每秒打印大约 30 个字符，这意味着每张双倍行距的页面只需不到一分钟。当它完成工作后，我拿起手稿，开始用铅笔修改，就像我以前做的那样。不同之处在于，在我做出更改后，我只需输入所做的更改并重新启动打印机，而不是重新输入整个混乱的内容。

又如：效率提升后带来的新的时间观念，让人变得更加不耐烦了。同时，更快的技术卖得更贵（磁盘比磁带快，但贵 1000 美元），但仍然会有人愿意为之买单。

最开始用 ChatGPT 的时候，我明显对听别人讲话变得不耐烦了，因为 GPT 的输出速度比人说话快多了。但在听 Podcast 的时候，速度调到 1.5x 我就很难抓住内容的要点。人们始终想要更快的速度，但不同的感官能接受的 IO 上限存在不同，需要选对媒介形态。

Computers cause another, more insidious problem, by forever distorting your sense of time. When I first saw the system in the back room at Optek, I was so dazzled by the instantaneous deletion of sentences and movement of paragraphs that I thought I could never want anything more. When the scientists at Optek warned me about certain bottlenecks, I had to stifle my laughter. In particular, they warned me that I might grow impatient with tape recorders as a way to store data. You have to understand, they told me, it can take five or ten minutes to load a long draft into the computer from tapes, whereas a disk drive (which would add a thousand dollars to the cost) could do the job in seconds.

计算机还会带来另一个更为隐蔽的问题，那就是永远扭曲你的时间感。当我第一次在 Optek 的后屋看到这个系统时，我被瞬间删除句子和移动段落的能力所震惊，我想我再也不想有其他东西了。当 Optek 的科学家警告我某些瓶颈时，我不得不忍住笑。特别是，他们警告我，我可能会对用录音机来存储数据感到不耐烦。他们告诉我，你必须明白，将一份长草稿从磁带加载到计算机中可能需要五到十分钟，而磁盘驱动器（这将增加一千美元的成本）可以在几秒钟内完成这项工作。

人们选择计算机有时候像在选择宗教，尽管这些机器的实际差别并没有那么大。

早期采用者（early adopters）的确会有这样的信仰充值行为，也是 marketing 可以通过品牌叙事来塑造的一种特立独行的形象。

Yet another hazard is that recommending the right computer is a little like recommending the "right"' religion. People tend to like the system they've ended up with. The most important point about computers, more so than about religions, is that the difference between a good one and a bad one is tiny compared with the difference between having one and not.

另一个危险是，推荐合适的电脑有点像推荐“正确”的宗教。人们往往喜欢他们最终选择的那个系统。关于电脑，比宗教更重要的一点是，好电脑和坏电脑之间的差别，与有电脑和没有电脑之间的差别相比，微不足道。

单一用途的机器往往不是销售给个人的，而是销售给企业的。All-in-one 和 Super App 对于 consumer 而言始终是最好的定位，而对于企业，则需要从把一件事情做好开始。

These single-purpose machines are generally sold not to individuals but to organizations, which presumably would rather pay the price for easily understood machines than train typists in complicated computer routines.

文章后半部分写了很多电脑选购的内容，和现在的上下文不大相关，可以跳过。

The Great AI Unbundling by Dan Shipper

Every 的创始人 Dan Shipper 在这篇文章中主要讲了 Excel 激发了多少 SaaS 公司的创业想法，而 ChatGPT 也可能是 AI 应用的灵感来源（他自己也在做一个 AI 应用叫 Spiral）。

他在文章末尾处写道：

The term “AI wrapper” has been a pejorative term. The implication is that no one is going to use a purpose-built AI tool when they can use a chatbot like ChatGPT or Claude for the same result.
But the opposite is true. ChatGPT and Claude increase demand for wrappers as people use them to find use cases that a general-purpose tool isn’t designed to accommodate.

“AI 套壳”一词一直是贬义词。其含义是，当人们可以使用 ChatGPT 或 Claude 等聊天机器人获得相同结果时，没有人会使用专门构建的 AI 工具。
但事实并非如此。ChatGPT 和 Claude 增加了对套壳产品的需求，因为人们使用它们来查找通用工具无法适应的用例。

我想借用最近很喜欢的另外一篇文章 The Arc of Collaboration 中的话来重新阐释这段话：

As a company’s processes mature and the apps they use get more sophisticated, we expect to see the need to go to Slack for exception handling *decrease* over time. (Though of course, the complexity of the overall company may increase at a faster pace than this maturation, leading to a net increase in slack messages).

随着公司流程的成熟和所用应用程序的日益复杂，我们预计使用 Slack 进行异常处理的需求将随着时间的推移而减少。（当然，整个公司的复杂性可能会以比这种成熟度更快的速度增长，从而导致 Slack 消息的净增长）。

为什么用 Slack 这个比喻呢？因为 Slack 也是一个聊天应用，上面这段话讲了一个重要的观点：聊天应用在整个通讯的堆栈中扮演一个兜底的角色，主要有三个作用：

Else 语句：当特定生产力应用程序无法处理某些事情时，Slack 是异常处理程序。随着应用程序内置处理这些用例的功能，以及公司建立内部流程，它的实用性会降低。
Watercooler：Slack 是同事的社交中心。这非常重要，而且充满了 gif。
元协调：是没有特定生产力应用程序的元级战略和协调的最佳场所。这实际上是一种“else 语句”，但可以以非结构化格式持续一段时间。

当企业开始用 Asana 处理项目任务，用 Ramp 处理报销单据，用 Notion 处理企业知识时，使用 Slack 的必要性就降低了。

混乱、无结构是聊天通信的常规状态。ChatGPT 也是这样：它被解释成是一个 Everything App，普通用户无法理解也不想学习 prompt 的高级用户，这时候「套壳应用」出现了，它们把一些常见的 use case 及其背后的复杂 prompting 变成更简单的用户交互，解决特定问题。Unbundling Slack 和 Excel 也可以认为是套壳。

最近听到的一个分类法是：静止状态和时间序列。Chat 是一个适合处理时间序列的界面，它始终是流动的，人机交互的预期是即时性的。但 use case 中有很多是会在一个静止状态下停留一段时间的，比如说一件事需要等到特定时间发生，或者需要满足某个条件发生，这就不是一个简单的时间线，而是静态基础上叠加逻辑。与之相对的是 Excel，是一个静止状态的界面，它也可以做 Gantt Chart，但只能手动更新状态。

On speaking to AI by Ethan Mollick

Mollick 尝试了 Apple Intelligence 端侧模型支持的新 Siri 和 ChatGPT 新发布的高级语音模型，并做出了自己的比较：

Siri 作为 Copilot 侧重于隐私和安全，使用小型模型在设备上运行。
ChatGPT Voice 作为 Agent 提供全面的 GPT-4o 模型，提供更多的控制和选择。

ChatGPT 的语音效果让 Mollick 很惊喜：

Working with ChatGPT via voice seems like talking to a person. Even though the underlying model is no different than the usual GPT-4o, the addition of voice has a lot of implications. A voice-powered tutor works very differently than one that communicates via typing, for example. It can also speak many other languages providing new approaches to cross-cultural communication. And I have no doubt people will have emotional reactions to their ChatGPT assistants, with unpredictable results.

通过语音使用 ChatGPT 就像与人交谈一样。尽管底层模型与通常的 GPT-4o 没什么不同，但添加语音有很多影响。例如，语音导师的工作方式与通过打字交流的导师非常不同。它还可以说许多其他语言，为跨文化交流提供了新方法。我毫不怀疑，人们对他们的 ChatGPT 助手会有情绪反应，结果难以预测。

Takeaway: 更加逼真的拟人可能解锁新的使用场景。我们不妨这样思考，AI 给人类的回复其实也是一种 prompts，是机器对人的提示和激发。当人类需要学习如何写更好的 prompts 来激发机器的潜力时，机器也应该更好的激发人类。更拟人化的语音就是这样一种尝试，通过语气、语调等变化来传递情感，一定会触发人类身上的特定反应，从而达成之前未能达成的效果，这也是人机交互中过去未能实现的点。

Asks

你的人生有过 pivot 的阶段吗？你是如何度过的？

← Back to Newsletter Archive