Home

09.02.24: 在曲线左侧找方法,抱脸和游荡的季节

考虑到 Grammarly 并不是一家那么知名的公司,我在上周写的《Grammarly:生于技术曲线左侧》一文,出人意料的受到了欢迎——也意味着更多的争议。一些读者告诉我,他们早就卸载了 Grammarly,而用 ChatGPT 替代。

Grammarly 无法在 2009 年创办的时候就预见这一点——没有人可以有这样的先见之明,但他们在 2023 年很快做出了反应,推出了 Grammaly GO 这个充分拥抱 LLM 的新产品,这个产品显然从他们过去 15 年的创业历程中汲取了大量的养分:

  1. 3000 万的活跃用户量级。这足以让 Grammarly 登上任何一个 AI 产品排行榜的前列,这甚至是 ChatGPT 都希望拥有的分发量。
  2. 特定用途界面产生的高质量用户反馈数据。单一用途软件(single-purpose software)的一个优势是可以设计更具象的界面来收集用户的明确反馈,比如让用户对修改建议点击接受或反对(Cursor 也是这么做的)。在 ChatGPT 上,这样的反馈按钮不可能占据如此喧宾夺主的位置——因为它要考虑更通用、抽象的用例。
  3. 基于专有数据和特定用例训练或微调的模型。这意味着更快、更便宜和更好的用户体验三者中的至少两个会发生。根据 Sacra 的最新文章:

Ramp、Notion 和 Databricks 等公司从 OpenAI 的 GPT-4 等前沿模型中获取输出,并使用它们来微调更小、更便宜、更快的开源模型,如 Mistral 和 Llama 3.1,从而将特定重复任务的成本降低 90%。 “您不必试图将这个大型模型的所有功能提炼成一个非常小的模型,而是使用特定任务的输出子集来训练较小的模型。 显然,这个较小的模型在很多其他领域无法与较大的模型匹敌,但对于特定任务,它可以。”

  1. 与企业数据和上下文(context)的整合。企业希望保持对外沟通的一致性,而这实际上是要求,所有员工都不能犯错。要做到这一点,就需要把符合品牌要求的风格指南、知识库等数据交给模型进行学习。这个操作的门槛很高,需要用户在开始使用之前上传很多文档、数据,才能达到预期效果。Grammarly 在这里需要和 Notion 等公司竞争。

我不是在为 Grammarly 这家公司辩护,但它显然已经跨越了最初的以规则为基础的 NLP 时代,产品形态上也不再是一个简单的语法检查器,或许它需要在品牌上做出突破,用新的叙事来转变市场对它的固有印象。

当然,对于一家成立了 15 年的公司而言,转变叙事很困难。

除了 Grammaly 之外,我们还为您带来了 Lux Capital 最新给 LP 的信中的精彩见解、GitHub 与 HuggingFace 生态系统的深度剖析,以及消费类应用大师 Nikita Bier 的病毒式传播秘笈。

💼
如果你是 AI 创业团队,正在寻找一起创业的伙伴,可以在这里填写招聘需求,我们将在 Platform Thinking 邮件组中广而告之。

Lux's Q2 Letter to LPs

在这封写给 LP 的季度信中,Josh Wolfe 探讨了当前风险投资对人工智能的热情是否过于高涨。他指出,尽管 AI 领域的资本投入急剧增加,但市场对这些投资的期望与基本面之间存在显著差距。随着投资者对回报的渴望加剧,许多新参与者可能陷入财务失利的境地。Wolfe 警告称,未来的风险投资环境将更加集中,只有少数顶尖公司能够在这一竞争激烈的市场中脱颖而出。

他做了一些简单的计算:

Investments make sense when returns exceed spending. Thus far in AI, roughly $50 billion has been spent on AI systems (based on Nvidia earnings), rounded up to $100 billion in annualized spending inclusive of energy and data center costs. For the industry to double the value of this capital investment, it would need to be valued by the public markets at $200 billion. AI software companies (including many of our own at Lux) are realizing revenue in aggregate of around $4-5 billion in just the last two years, undoubtedly impressive and yet also far short of returning $200 billion given present multiples, particularly with Microsoft resetting investor expectations about a longer-term payoff.
当回报超过支出时,投资才是有意义的。迄今为止,人工智能领域已花费约 500 亿美元用于人工智能系统(基于 Nvidia 的收益),包括能源和数据中心成本在内的年度支出总计达 1000 亿美元。如果该行业要将这笔资本投资的价值翻一番,就需要公开市场将其估值为 2000 亿美元。人工智能软件公司(包括我们 Lux 的许多公司)在过去两年内实现的总收入约为 40-50 亿美元,这无疑令人印象深刻,但考虑到目前的倍数,也远远达不到 2000 亿美元的回报,尤其是微软重新设定了投资者对长期回报的预期。

Lux Capital 是一个很有特点的 VC,特别专注于投资 Deep Tech。他们寻找投资机会的方式跟着科学研究的前沿走,往往能够在曲线左侧就发现机会。

What Lux and some forward-leaning companies grasp is that extraordinary commercial potential lies in ambitious and entrepreneurial scientists working in research labs with an explicit resistance to immediate expectations of commercialization. Business models and monetization have proven in the right circumstances to evolve as fast as repositories of code. Indeed, trillions in market capitalization have come from venture-backed startups from just such individuals. Naming conventions of many high-tech venture-backed companies have even embraced this open possibility by appending “Labs” after their names.
Lux 和一些有远见的公司意识到,非凡的商业潜力在于那些在研究实验室里工作的雄心勃勃、具有创业精神的科学家,他们明确反对立即实现商业化。事实证明,在适当的情况下,商业模式和货币化会像代码库一样快速发展。事实上,数万亿美元的市值就来自这些个人创办的由风险投资支持的初创公司。许多高科技风险投资支持的公司的命名惯例甚至接受了这种开放的可能性,在公司名称后加上“实验室”一词。

Josh Wolfe 还上了 The Logan Bartlett Show。他在其中讲到自己如何通过 20 几份报纸来获取信息,以及青少年时期恶劣的成长环境塑造了他更敢于冒险的性格。他也谈到,自己在投资科学家的时候,很像是星探发现了一位才华横溢、但还未成名的艺人。

Github and its analogs

Peter Zakin 是 Upfront Ventures 的投资人,这是他 2023 年 8 月写作的文章。

这篇文章其实写了三家公司:GitHub、GitLab 和 HuggingFace,前两个我都曾经写过 Deep Dive,所以 Zakin 的很多观点都很有共鸣。

GitHub 同时占有了两件事情,都是从其源头 Git 继承下来的:第一是围绕开源代码分享的开发者社区,第二是围绕版本控制建立的开发者工具流。我在 GitHub 的 Growth Deep Dive 中更完整的介绍其产品功能,可以前往阅读。

Zakin 认为,Github 在开发者工作流程中的核心地位,使得它处于最佳位置来追求广泛而有意义的产品扩展。他举了两个例子:

一是 GitHub Actions,成为 CI/CD(持续集成)的平台。

Github is optimally positioned to be the central automation platform for code events for a few reasons. First, the kind of key lifecycle events that might instigate workflows occur within Github (PR creation, merge events etc…). Second, because Github is the aggregator for the world’s code projects, Github has the platform power to lure relevant service providers.
首先,可能引发工作流的关键生命周期事件发生在 Github 中(PR 创建、合并事件等)。其次,由于 Github 是全球代码项目的聚合器,因此 Github 拥有吸引相关服务提供商的平台能力。

第二是 AI 代码辅助,也就是 GitHub Copilot。

Their vast collection of open source code positioned them to train generative models for code production. Their brand power and early-mover status gave them a distribution advantage over other code assistants. Admittedly, this advantage is not yet structural. Competitors arguably are on even ground when it comes to offering their own copilot alternatives.
他们拥有大量的开源代码,这使得他们能够训练生成代码的生成模型。他们的品牌影响力和先行者地位使他们比其他代码助手具有分销优势。诚然,这种优势还不是结构性的。在提供自己的 Copilot 替代品方面,竞争对手可以说处于同等地位。

然后讲到了 GitLab。这家公司我也在早年写过一篇文章,但是时间太过久远,今天来看很多地方都值得重写。Zakin 一针见血的提出了一个问题,为什么在 2012 年 GitHub 如日中天(当年它从 A16Z 融资 1 亿美元)的时候,Sid Sijbrandij 会创办一家从各个方面看都没有明确差异化的公司?

Zakin 给出了他的分析:

But to their credit, Gitlab found a usage pattern that made them competitive with Github. As an open source product, Gitlab was well-positioned to sell into enterprises who were looking to self-host their source control system. This is what catapulted them to their Series A in 2015 from Khosla Ventures.
但值得赞扬的是,Gitlab 找到了一种使用模式,使其能够与 Github 竞争。作为一款开源产品,Gitlab 非常适合向那些希望自行托管源代码控制系统的企业销售产品。这就是他们在 2015 年从 Khosla Ventures 获得 A 轮融资的原因。

没错,就是通过向企业客户提供开源的替代方案来与 GitHub 竞争。实际上,这可能是一种通用的竞争思路:面对强大的闭源竞争对手,通过开源方式,能够更快速的建立企业客户的信任。难点在于,在开源软件的基础上设计商业模式。

Gitlab 的答案是「完整的 DevOps」:

At their Series C in 2017, their vision had crystallized to capture every aspect of the DevOps lifecycle. They called it “Complete DevOps”.
That being said, I’m somewhat suspicious of the ergonomic benefits of coupling your source control system with your monitoring offering. That seems more like drafting on customer desires for vendor consolidation than a bona fide product advantage.
在 2017 年的 C 轮融资中,他们的愿景已经明确,涵盖了 DevOps 生命周期的各个方面。他们称之为“完整的 DevOps”。

当然,Zakin 认为 GitLab 的方案是「根据客户对供应商整合的需求起草计划,而不是真正的产品优势」。

最后进入 HuggingFace 的分析。

HuggingFace 是一家值得单独进行 Deep Dive 的公司。很多人听到这个公司的时候,会自然的把它和 GitHub 做比较,虽然它最初是一个面向消费者开发的 chatbot 产品。在打造产品的过程中,HuggingFace 开源了其 Transformers 模型代码,在开发者社区中意外的流行起来。一年后的 2019 年,它们从 Lux Capital 那里融资 1500 万美元,希望成为开源 Transformers 模型的标准工具包。

在 Lux 2019 年的投资公告中,Brandon Reeves 写道:

Hugging Face 提供可用于生产的预训练 Transformer 模型,节省了数天到数周的时间以及数十万美元的计算资源;pytorch 和 tensorflow 都提供了编程接口,用于针对生产中的不同应用(例如文本分类和生成)微调模型。如今,已有 100 种不同语言的 30 多个预训练模型,并且每周都在增加……行业将继续发展,我们相信 Hugging Face 将成为每个开发人员用于理解和生成自然语言的事实上的技术和 API。”

到了 2020 年,HuggingFace 上的开源模型数量达到了数千个,被广泛认为是 GitHub for ML。这是一个有趣的案例:平台第一方贡献了冷启动所需要的最初的内容(HuggingFace 自己的 Transformers 模型代码),而后转向吸引平台上的其它贡献者来提交内容。

Zakin 认为:目前,HuggingFace 可以理解为两种主要产品的组合:

开源 ML 工件(模型、数据集)的中心。提供补充服务,帮助开发人员完成与模型相关的工作流程:训练、部署、演示。

和 GitHub 模式高度一致。

Zakin 对 HuggingFace 的担忧与他对 GitLab 的类似:是否能天然的从 1 变成 2。用户可能通过 HuggingFace 下载开源模型,但可能会用其它的服务商来开展训练、部署等工作流。这两者的连接并不是无缝的,前者更像是后者的一个引流工具,而不是天然集成。

Zakin 最后写道:

Building the most central workflow for any kind of discipline is often a recipe for a successful company. In traditional SaaS, that usually means being the system of record. For creative disciplines, I would argue that it means being the most central workflow that also serves as a nexus for collaboration.
为任何学科构建最核心的工作流程往往是公司成功的秘诀。在传统的 SaaS 中,这通常意味着成为记录系统。对于创意学科,我认为这意味着成为最核心的工作流程,同时也是协作的纽带。

How to consistently go viral: Nikita Bier’s playbook for winning at consumer apps (co-founder of TBH, Gas, advisor, investor)

Nikita Bier 在 Lenny 的 podcast 上分享了他在消费应用程序成功背后的秘密。尽管许多应用的成功似乎是随机的,但 Bier 认为,增长实际上可以通过科学的方法来实现。他强调了将病毒式传播的短期成功转化为长期可持续增长的重要性,建议开发者关注用户的内在需求和行为。通过数据驱动的决策和对市场信号的敏感反应,团队可以更好地捕捉到潜在的机会,创造出持久的产品。Bier 指出,年轻用户的社交行为是开发新应用的关键,因为他们更容易接受新的沟通工具。

这个访谈的多个片段都被剪辑出来在互联网各个角落上传播,但其中最重要的一些 quote 如下:

为什么年轻人,特别是 13-18 岁的年轻人,对于打造病毒传播的社交产品最为重要?

⁠⁠A lot of people ask why Silicon Valley is so fixated on building apps for teens. One of the reasons is their habits are pretty malleable. As we get older, we get fixed into our habits of using certain communication products and we don't really adopt new things.⁠⁠
⁠⁠Then the other thing that we discovered was that adults don't really invite people to new apps. We found that as a user got older from age 13 to 18, the number of people that they invite to an app just declines almost exponentially.⁠⁠
⁠⁠Finally, and the most important thing is they see each other every day, and that is so critical. Consumer app developers sometimes say smokers are great for targeting an audience because they actually hang out serendipitously a lot outside of buildings. Not to say social apps are cigarettes, I don't really like that metaphor.
⁠⁠很多人问为什么硅谷如此执着于为青少年开发应用程序。原因之一是他们的习惯非常容易改变。随着年龄的增长,我们会习惯使用某些通信产品,而不会真正接受新事物。⁠⁠
⁠⁠然后我们发现的另一件事是成年人实际上并不邀请人们使用新应用程序。我们发现,随着用户从 13 岁到 18 岁年龄的增长,他们邀请使用应用程序的人数几乎呈指数级下降。⁠⁠
⁠⁠最后,最重要的是他们每天都会见面,这一点非常关键。消费者应用程序开发人员有时会说,吸烟者非常适合定位受众,因为他们实际上经常在建筑物外闲逛。并不是说社交应用程序是香烟,我不太喜欢这个比喻。

打造消费者产品的秘密在于可重复的测试流程

The most important thing that I often instruct teams to do is to develop a reproducible testing process, and that will actually influence the probability of your success more than anything. It's so unpredictable whether a consumer product idea will work.
我经常指导团队做的最重要的事情是开发一个可重复的测试流程,这实际上会比任何事情都更影响你成功的可能性。一个消费产品创意是否可行是如此不可预测

找到潜在需求:人们想要得到某种特定价值,但是是以非常扭曲的方式获得的,这时候就有一个显然的机会:减少这种扭曲。

The number one app in the United States was in Arabic. And that was one of the most strongest signal that you could ever have that people want something.
And so when I meet with founders, I often tell them like, "The way you should be searching for product ideas is this concept of latent demand where people are trying to obtain a particular value and going through a very distortive process to obtain that value."
美国排名第一的应用程序是阿拉伯语的。这是人们想要某种东西的最强烈信号之一。
因此,当我与创始人会面时,我经常告诉他们,“你应该以潜在需求的概念来寻找产品创意,人们试图获得特定的价值,并经历一个非常扭曲的过程来获得这种价值。”

如何回答:如果 Facebook / Google / Tencent 做了这个产品怎么办?

It's not only harder for them to identify these opportunities and to verbalize it internally and align the company around it. It's also hard to respond to signals in the market. A lot of people think these incumbents are going to steal your ideas.
And for the most part, it takes a pretty long time for them to respond to even the number one app or charting in the app because it'll start charting in the app store, a PM will make a post about it. And then the market's strategy or market research team might do a study to follow up on it.
It'll kind of float around for a few months. They might put together a framing deck saying, "Hey, we should go after this opportunity. Let's put together this team. It'll go through VP reviews. And then it'll start development. Development might take six to 12 months."
Realistically, I think most companies, large companies take 12 to 24 months to respond to competitive threats in the market.
他们不仅难以识别这些机会,难以在内部将其表达出来,也难以围绕它调整公司。他们也难以对市场信号做出反应。很多人认为这些在位者会窃取你的想法。
在大多数情况下,他们需要很长时间才能对排名第一的应用程序或应用程序中的排行榜做出反应,因为它会在应用商店中开始上榜,PM 会发布有关它的帖子。然后市场战略或市场研究团队可能会进行研究以跟进。
它会在几个月内徘徊。他们可能会整理一个框架说:“嘿,我们应该抓住这个机会。让我们组建这个团队。它将通过副总裁的评审。然后它将开始开发。开发可能需要 6 到 12 个月。”
实际上,我认为大多数公司,大公司需要 12 到 24 个月来应对市场上的竞争威胁。

Plus:来自 Shaan Puri 的「战略性破产」和「游荡的季节」

周五的晚上,我收到一位朋友的 email 转发了 Shaan Puri 的一篇文章。

Shaan Puri 是一位在科技和创业圈备受瞩目的多面手人物。

在播客界,Puri 与 Sam Parr 联手主持了广受欢迎的节目 "My First Million"(我的第一个百万)。这档节目以其独特的头脑风暴环节和深入的创业讨论而闻名,为听众提供了宝贵的商业洞察。

作为一名连续创业者,Puri 的成功案例中最引人注目的是 Milk Road。这是一个专注于加密货币新闻的通讯服务,最终被成功收购,展现了他在新兴科技领域的敏锐嗅觉。

在投资领域,Puri 也颇有建树。作为一名活跃的天使投资人,已经在超过 25 家初创公司投下重注。

How I spent a year “strategically broke” (pics and number inside)

Puri 花了一年时间“战略性破产”,没有工作、没有薪水,也没有计划。这段经历让他追求创造性生活,最终找到真正想做的事情。通过“游荡许可”(permission to wander)系统,Puri 不断探索我的职业方向。

UNCLE SHAAN’S EAZY-PEEZY 3-STEP PLAN TO FIGURING OUT WHAT YOU WANT TO DO IN LIFE™️

接续上一篇文章,Puri 介绍了如何找到自己真正想做的事情。首先,打破对职业的幻想,进行短期尝试;其次,给自己一个“游荡的季节”,探索不同的选项;最后,寻找能量和成功的线索,从中得到灵感。实现理想职业的关键在于热爱和实践。

Reflections

早上读到一个 说法,叫「技术的舒适区」,据称是曹曦提出的。文章写道:

曹曦之前文章用到了一个很好的描述 —— “技术的舒适区”,一般来说成功的公司都是在技术的舒适区里展开商业模式,而不是在技术的绝对前沿。要判断 AI 产品是否在技术的舒适区,只需要看是否 “抽卡” —— 意思是可灵/Sora 这种在抽卡阶段的模型,用户为了生成一条心仪的片段,需要点很多次 “重新生成” 或 “重新运算”。我司在美国有一定规模的 AI 娱乐产品的 “regenerate” 按钮使用比例大概是 20%,AI 卡路里产品的更高,而我们营收跑的最好的产品小于 1%。我们自己没有做 AI 生产力工具,但是据我所知多数产品的抽卡率都还蛮高;有一些聪明的产品直接在结果页面给出 4~10 条不同的,这和谷歌搜索有异曲同工之妙。

「技术的舒适区」和「技术曲线左侧」事一件事情吗?

其实是一件事。但是「舒适区」这个说法其实有点主观判断。上面讲到了几个例子,比如:regenerate 按钮和「抽卡」都是让用户做自己的选择。现在 LLM 生成结果的稳定性和可控性是一个大问题,太多的创业公司产品其实都在为这些「缺陷」打补丁,要么是放一些规则在里面,要么是交互上做一些创新,总之,都不是大撒把式的把全部工作都交给模型。

曲线左侧就是描述了这样的状态,但这是不是「舒适区」呢?其实一定不是太舒适。创业公司本来就是在不太舒适的情况下,把体验做得比较舒适,才有突破的机会,否则,游戏规则就转变为渠道和分发能力上的竞争了。

Lux Capital 的 Josh Wolfe,站在投资人立场上,也讲过类似的话:

I like to think of risk and value almost like the first law of thermodynamics. So first law of thermodynamics, energy is not created or destroyed. So if we looked and put on the table, metaphorically, embodiment of all the risks of a company, financing risk, market risk, technology risk, people risk, competition, you know, you name it. Every risk that we can identify and kill with time or talent or money thrown at it, a later investor that comes, six months, six years, whatever it is, they should pay a much higher price and demand a lower quantum of return.
我喜欢将风险和价值视为热力学第一定律。热力学第一定律就是能量不会被创造或毁灭。因此,如果我们从隐喻的角度看待并列出公司所有风险的具体表现,包括融资风险、市场风险、技术风险、人员风险、竞争风险等等,你知道的,你能想到的。我们能够识别并消除的每项风险,只要我们投入时间、人才或金钱,那么后来的投资者(无论是六个月、六年还是其他什么)就应该付出更高的代价,并要求更低的回报。

这就是早期创业和投资的乐趣所在。今天出现估值倒挂等等问题,其实都是因为进入成长期(一般是 B 轮以后)之后,太多没有差异化的资本竞争使然——唯一的谈判筹码变成了估值。而在早期,没有太多非共识的情况下,竞争少太多,难度变成如何识别和消除风险。

识别风险,需要形成找寻信号的方法。太过于普适性的方法很难找,所以一种做法就是缩小范围,在特定领域形成深厚认知。Wolfe 和 Lux Capital 的领域就是 Deep Tech,他们熟悉科研学术圈,很了解科学研究前沿的各种问题,知道该在哪里找问题,有问题该去问谁。

消除风险,Wolfe 认为有三个点:时间、人才或金钱。时间是自然杀死风险的办法,随着时间推移,很多不确定性会在给定的世界中变成确定性,并衍生出后果和影响来。而人才和金钱,比如请一位自身的行业专家来做高管,则是加速时间线的方法,但这种加速也一定会扭曲时间线。

方法论的形成需要样本量,在正确和错误的结果的反复衡量中,得到总结。

📆
面向「完全访问」订阅会员的线上 Chat 开始 beta 测试,请用下面的链接预约时间。请提供希望讨论的主题方向,便于事前准备。
🔗 https://calendly.com/neozhang/chat-pt-plus

← Back to Newsletter Archive