11.11.24: 科技选战

November 11, 2024

本周的通讯探讨了技术如何重塑我们在这个日益复杂的世界中寻找真相和做出决策的方式。从美国超级星期二初选中，我们看到预测市场的表现优于传统民调，社交平台 X（前身为 Twitter）达到创纪录的用户参与度，而各家 AI 公司则谨慎地界定着自己在选举信息传播中的角色。这些现象背后有一个共同的主题：当传统机构难以跟上去中心化信息流的节奏时，新的数字工具和平台正在涌现，帮助我们理解现实。

这个主题贯穿于我们对微软 AI 整合战略、OpenAI 的组织成长困境，以及 Anthropic 定价模式演变的分析。我们正在见证 AI 工具被逐步编织进工作和思考方式的早期阶段——尽管这个过程并不总是优雅或可预测的。

在本期精选文章中，我们研究了从 YouTube 早期历史到中国现代教育改革的多个案例，从中寻找变革性技术如何重塑人类系统和机构的模式。一个清晰的脉络正在显现：我们正处在一个信息的发现、验证和行动方式被根本性重构的时代。

News + Neo's

Big Tech

微软正在为 Windows 11 Insider 用户将 AI 功能整合到核心应用程序，如画图和记事本中。画图新增了“生成填充”功能，可通过文本描述添加元素；“生成擦除”功能，可移除不需要的对象；以及改进的“Cocreator”和“Image Creator”功能。记事本新增了 AI 驱动的“重写”功能，可提供文本变体并提升启动性能。这些功能，以及在部分亚太地区市场将 Copilot 捆绑到 Microsoft 365 订阅中，凸显了微软致力于在其产品生态系统中整合 AI 的重点。Windows Blog, The Verge

Neo's - 微软加快了在 Windows 和 Office 两条产品线上的 AI 功能整合。要记住，这是一家擅长捆绑和跟进策略的公司，他们擅长利用自己已有的庞大用户基数来推进新技术的采用。但就目前来看，软件巨头的创新步调仍然比较混乱，或许是历史包袱太过沉重，或许是内部缺乏必要的战斗力，上面的提到的功能整合都没有太多心意，功能实现上也不够优雅。

Growth

OpenAI 本周持续发生人事变动：Caitlin Kalinowski 宣布加入 并担任机器人和消费者硬件负责人，在此之前，他在 Meta 负责了包括 Orion 在内的 AR 眼镜开发。曾经负责安全研究的团队的 Lilian Weng 则 宣布离开 OpenAI。

在 与 YC 总裁 Garry Tan 的对谈 中，Sam Altman 讲道：

ChatGPT 还不到两岁，而这种快速发展带来了很多痛苦的过程。任何公司在规模扩大时都会经历不同的管理团队，而那些擅长从 0 到 1 阶段的人不一定适合从 1 到 10，或者从 10 到 100 的阶段。（译文来自有新）

OpenAI 收购了域名 Chat.com，并将其重定向到 ChatGPT。虽然收购价格未公开，但该域名之前的拥有者，HubSpot 联合创始人 Dharmesh Shah 曾以 1550 万美元的价格购入。TechCrunch

Neo's - OpenAI 在打一场没有人知道结果的逆风局。在讨论它所碰到的诸多问题时，很少有人会记得这家公司的年龄。它所碰到的组织问题其实是它所经历的增长速度的投影。Sam Altman 的 X 账号最近一周发文频繁，但主要是关于 OpenAI 的产品和模型，没有提及任何与人事变动相关的内容。他提到 ChatGPT 宕机了 30 分钟，并顺便提及 ChatGPT 已经是世界上第八大网站——或许只有增长才能掩盖一切问题吧。

收购 Chat.com 域名、推出搜索功能和 Chrome 插件（安装后默认搜索会被切换到 ChatGPT 上），这些都是 Growth Hacks，一定会在短期带来不错的数据。而大家真正期待的，还是在今年最后两个月内即将释放的新模型，能否让 OpenAI 重新回到 SoTA 的领先位置。

Anthropic 提高了其 Claude 3.5 Haiku 模型的价格，理由是其性能优于之前的 Claude 3 Opus 模型，尤其是在编码、数据提取和内容审核方面。虽然 Claude 3.5 Haiku 缺乏图像分析功能，但较旧的 Claude 3 Haiku 仍然可供优先考虑成本效益和图像处理的用户使用。Claude 3.5 Haiku 的新定价为每百万输入 token 1 美元，每百万输出 token 5 美元，增加了四倍。TechCrunch

Neo's - Anthropic 的版本号真的很令人疑惑，3.5 Sonnet 同时存在两个版本，据说 3.5 Haiku 比上一个版本的 3.5 Sonnet 要更好，实际使用起来，很难分辨其中的差异。我相信产品营销团队并不同意用这样的版本号进行发布，但竞争变化太快，以至于大家都没有时间对版本号和产品名进行详细规划。

Haiku 定价的提升可能不是完全由成本决定的，而是综合考虑了模型能力所体现出来的价值。在模型竞争逐渐收敛到少数玩家的阶段，我们可能会越来越多的看到领先模型获得溢价，本质上是稀缺性的反映——其它缺乏区分度的模型仍将继续在成本线上下艰难的进行价格战。

本周 Anthropic 官方宣布了与 Asana 的合作，后者将全面采用 Anthropic 的模型，公告中讲到双方合作的主要理由是在透明、安全和道德方面愿景一致。这或许说明，在企业场景，模型安全和伦理并非只是道德正义，而是真的可能影响合作成败。

除了 Anthropic 之外，Google Gemini 也很重视这一点，其 API 中内置了安全相关的参数，最近还推出了利用 Google Search 进行 Grounding 的新功能，即通过 Google 搜索来提供信息来源。为了应对 Gemini Grounding with Google API，Perplexity API 也增加了 Citation 来源数据。PS: Google Gemini 最近迭代很快，还提供了 OpenAI 兼容模式的 API 调用，大大降低了从 OpenAI 到 Gemini 的切换成本。

SPECIAL: Tech Elected

选举日，全世界都需要找到答案。

在这次大选中，世界重新认识了 Twitter / X 的价值，Elon Musk 表示，他以 440 亿美元收购的这家社交媒体在选举日当天达到了 4341 亿秒的用户时长。我曾经在之前的 newsletter 中多次关注他在收购之后对这家公司进行的转型动作，包括大幅削减工程师数量，把品牌名称从 Twitter 改为 X，推进 Premium 订阅，改变社区政策等。他还认为 X 应该像微信一样增加视频和支付功能，但后者至今未能实现。但无论如何，Twitter 的名字很可能在此后正是成为历史，人们将记住一个更简单、也更与历史相关的名字——X。

预测市场是另一个在本次大选中进入公众视野的新平台类型。

Kalshi 是选举日 App Store 上排名第一的应用。Polymarket 的 CEO 声称，Trump 竞选团队首先从 Polymarket 统计数据中意识到他们正在获胜，这些数据在新闻网络宣布选举结果的几个小时前就显示他们以压倒性优势获胜。一些科技和金融界人士认为，这些博彩市场现在比民意调查更能体现“群众智慧”。一位法国人在这个平台上下注 Trump 获利高达 4700 万美元。阑夕整理了 WSJ 对此事的报道。

Robinhood 的创始人 Vlad Tenev 在 X 上讲道：

As news becomes entertainment, markets become the news.

随着新闻成为娱乐，市场就成了新闻。

这句话耐人寻味，他在访谈中解释说：

新闻更多地转向娱乐领域。新闻的目标不再是提供信息，而是吸引和娱乐。这需要以尽可能直接和清晰地传递信息为代价。我认为随着时间的推移，这导致人们对传统新闻产生了很大的不信任。预测市场具有这样的特性：人们真正参与其中。它们能更快地反映新信息。在 2016 年，尤其是在 2020 年，你看到了这种情况的发生，预测市场在人们跟踪选举的方式中发挥了更大的作用。

这是获取最新信息的最快方式。您在选举之夜的新闻中看到了这一点。各大电视台直到预测市场的结果相对明朗几个小时后才致电各州。因此，您可以选择：如果您想知道选举的进展，您可以观看电视台，听人们辩论，并试图弄清楚谁会获胜，或者您可以打开 Robinhood 查看正在发生的事情。我认为这就是为什么，如果你看看交易量，就会发现它在新信息进入市场时确实会飙升和增加，特别是在选举之夜。我认为它们受欢迎的原因是这是处理和理解信息的最有效方式。

在交易对手众多而高度分散的市场中，市场机制的确很有可能平衡信息的真伪。去中心化系统的一个缺陷是反应可能不够快，但在这次选举中，它却表现得很好。一个可能的原因是，选举本身也是去中心化的。美国地广人稀，大城和小镇上的选情截然不同；在选情地图上，经常是一大片红色围着一点蓝色。传统媒体对这些分散信息的处理能力很差，一个表现是，电视节目上经常是一个主持人对着地图，从一个州的总体选情开始，然后逐渐 zoom in 到每一个 county，然后再往下是每一个 town，而每一次 zoom in 的结果经常是一小点蓝色被一大片红色包围（蓝色的往往是人口较为集中的城镇地区，红色的则是人口分散的乡村地区）。这种处理的方式是自上而下的树状检索。而预测市场是根据每一个交易者的个体认知通过每一次买卖不断进行矫正。赚了 4700 万美元的法国人甚至自己做了民调来获取一手信息，而非依赖于因为自上而下而过度简化的传统媒体报道。

美国总统选举是预测市场发挥作用的合适场景，但不是所有预测都有这么多人关心。

AI 搜索引擎 Perplexity 为大选夜制作了一张实时更新的专题页面。页面上展示的各州投票数据来自于美联社——这是历次大选较为没有党派倾向的媒体。TechCrunch 报道了 Perplexity 在回答选举相关问题时的表现，文章中使用了“轻微的幻觉”或“没有幻觉”这样的评价。

OpenAI 的 ChatGPT 虽然也增加了搜索功能，但它在大选相关的搜索或问答上表现得相当保守。在官方博客上，这家公司声明自己实施了保护措施，引导人们获取可靠的信息来源，防止深度伪造，并打击恶意行为者的行为。对于选举信息的查询，ChatGPT 引导用户前往 CanIVote.org 网站，而拒绝给出直接回复。

在选举日，Google 出现了搜索问题，即像“where to vote for Harris”这样的查询会触发投票地点地图，因为“Harris”是德克萨斯州的一个县名，而类似的“Trump”搜索则不会。该公司很快就实施了修复。

关于如何得到答案，工具很多，但每一个都有自己的问题。

Links + Notes

If you need the money, don't take the job

John Arundel 以提供软件开发顾问为生，但是他的这篇文章值得所有需要为产品或服务定价的人阅读。

Arundel 提出了一个关于咨询的迷人比喻：

偷猎者追求快速收益后迅速离开
农夫与客户建立长期关系

他的建议当然是做“农夫”而非“偷猎者”。

重复业务是最好的业务，因为营销很难。慢慢地，你将不再需要营销自己的服务。人们会主动找到你。到那时，你就知道自己做对了。

一家企业应该在某个时间点更明确的知道自己是不是已经过了获取新客户的阶段，这可以在每年做战略规划的时候提出这个问题。服务什么样的客户是一个前提假设性的问题，影响了一切其他的战略决定。如果已经达到了最佳临界点，不如花更多时间在已有的客户上。

文章还介绍了“芝华士伏特加效应”——企业实际上更愿意为咨询服务支付更高价格，因为：高价格意味着质量，昂贵的问题看起来更重要，职业经理人为解决“昂贵”问题获得更多赞誉。

他的定价建议是：

想一个数字，然后把它翻倍。如果报价时你没有一点尴尬，那可能意味着你定价太低了。

一个反直觉的洞见：

确保他们付给你足够的钱，这样他们才会听你的建议。

客户支付的越少，越不可能采纳你的建议。高价创造问责制和尊重。

AI 意味着软件和服务的重新定价。一个早期发现是，当一件工作中明确包含更多 AI 成分的时候，客户倾向于认为他不应该支付很多钱，因为这是机器而非人工的工作。

这种价格判断建立在过去机器用来做大规模标准化生产的前提下。AI 是一种不同的机器，它提供的产出并不是千篇一律的。但客户不这么想，一方面他们认为自己并没有买到独特的服务，因而不应该支付太多溢价，另一方面他们可能会以成本定价的方法来想，为什么我要为一个 token 支付这么多价钱。

Letter #232: Jawed Karim (2006)

本文来自 YouTube 联合创始人之一 Jawed Karim 在 2006 年的一次演讲，回顾了了 YouTube 的早期历史。由投资人 Kevin Gee 整理。

演讲前半部分花费了很多时间考古了 Web 2.0 的一些早期产品，可以略过。这些例子大多数在今天已经不再相关。它们的共同主题是：如何让用户上传内容并产生互动这件事变得流行起来。

演讲直到这里才变得有趣起来，Karim 提出了一个问题：

So one good question to ask is, Well, in 2004, which is, by Internet standards, ancient, ancient history, what did things look like before YouTube? How did people share videos? What was the best way to share videos?

所以，一个好问题是：那么，2004 年，按照互联网标准，已经是上古历史了，YouTube 出现之前的情况是怎样的？人们如何分享视频？分享视频的最佳方式是什么？

就是上面这张图片。

很多读者甚至于都没有见过这样的界面。它具有充分的年代感，也很暴露年龄。在 YouTube 之前，分享一段视频的方式就是通过 FTP 等文件传输协议，把一个视频文件上传到服务器上，然后告诉其他人文件地址。其他人需要下载（网速极慢）整个文件，然后在本地播放视频。

播放视频本身并不简单。因为视频编解码也没有统一的标准。在演讲中，Karim 提到了 DivX 和 Xvid 这一对技术名词，让我有一种恍若隔世的感觉。暴风影音这样的软件就是从本地视频解码这个需求点入手逐渐起家的。

Karim 总结 YouTube 成功的四个关键技术支撑：

家庭宽带普及：下载速度的飞跃
Macromedia Flash 7 技术：打包了视频编解码服务
数码摄像机普及：视频创作门槛降低
低成本带宽托管：视频托管成本降低

在这个几个大前提都满足的情况下，YouTube 以“视频版 Flickr”的面目诞生——Flickr 是一个图片分享服务，后来被 Yahoo 收购）。

YouTube 团队最初的推广策略是这样的

在 Craigslist 上招募漂亮女性，每人 100 美元制作 10 个视频——成本高昂
给 Wired 记者群发邮件——无人回复
给朋友群发邮件推广——没什么效果

Karim 认为，创业成功充满了偶然性因素，但当他们发现 YouTube 上的爆款视频每天都会出现，而且出现的频率越来越高的时候，他们就知道，YouTube 已经抓住了偶然性的红利——这些爆款视频会自行传播，同时为 YouTube 带来新用户。

Karim 还提到了社区的价值。YouTube 的社区最开始建立在每个视频的评论区中。爆款视频也带来了评论量的增长，用户首次发现，在线视频还可以与相同兴趣的用户产生互动，这就让 YouTube 在内容之上还有互动的价值。

Karim 讲道：

现在，我们曾预测社区将成为这个网站的核心部分，但我们没有预料到人们会如何使用这个网站。例如，他们会这样做，有人会发布一段视频来讨论某事或做某事，然后所有其他用户都会回复该视频，他们会说，哦，是的，我看了你的视频，我觉得你说的话很无聊，或者很酷，或者其他什么。所以他们创造了视频回复的概念。

很难想象，视频回复（Video Response）在二十年前就已经在 YouTube 上出现，而现在它也出现在 TikTok 上。

社区正在驱动这个产品。他们正在找出使用它的新方式，我们要做的就是适应并允许他们以任何方式使用它。

YouTube 团队很快增加了一个功能，在一个视频下面列出所有和这个视频相关的“视频回复”。

这个功能推出之后，YouTube 的访问量数据出现了大幅上涨，团队开始见投资人，省下的就是历史了。

相关阅读：字节跳动的图虫往事 - 一篇来自于晚点团队的报道，以图虫为着力点，讲字节的创业心气。字节跳动悄然出售了图虫。随着公司规模的扩大，字节逐渐失去了早期的创业精神，变得像其他大公司一样臃肿。图虫的出售反映了字节在追求规模的过程中，创业创新的活力逐渐消散。人类长生不老和企业基业长青是两大难题，但目前来看，没有谁会永垂不朽。

从中国人口趋势看教育发展的方向

这是俞敏洪和梁建章在一个论坛上的对谈，主要谈的是孩子的教育。因为我最近也比较关注这个话题，所以摘录一些内容来读。

在中国人口持续下降、教育资源过剩的背景下，两位顶级企业家对教育的未来提出了极具前瞻性的思考。他们的对话不仅仅是关于教育，更是对整个社会转型的深刻洞察。

人口数据已经发出严峻警告：过去七年，中国新生儿数量从 1800 多万骤降至 900 万。这一趋势背后是高昂的养育成本和教育竞争的巨大压力。梁建章和俞敏洪敏锐地指出，中国正在进入一个教育资源多于出生人口的独特阶段。未来 17 年，大学招生名额可能会超过新生人口总数，这意味着教育竞争的生态正在发生根本性变革。

俞敏洪：根据现在的人口出生总量，去年是 900 多万。中国大学的学生总量，按去年的出生率来看，再过 17 年所有的大学都招不满。因为我们不可能每个孩子都去上大学，上大学本科的概率是 60% 到 70%。中国现在一年本科录取量是 600 万到 700 万，不算技术学校和大专，让全体学生上本科，大学校园都放不满。我最近看到一个新闻报道，有的大学新建校园被叫停了。往前延伸，再过几年，不少小学也要关闭，因为小学填不满人了。再往后，一部分初中也要关闭。也就是说，中国已经迎来了教育资源多于出生人口的状态，这意味着未来要做好的话，中国优质教育资源可以相对普及和集中；教育领域的竞争可以弱化。

最令人振奋的是，两位企业家提出了超越传统应试教育的全新理念。他们认为，未来的教育应该从“分数至上”转向“个性发展”。俞敏洪甚至设想在高考中增设专业方向的特长考试，让学生可以在自己擅长的领域获得更高分数，而不是要求每门课程都达到近乎完美的水平。这种方法不仅能发掘学生的独特天赋，还能减轻学习压力。

俞敏洪：我在全国两会曾经提出，高考有没有可能变成选拔各个领域有天赋的人的考试，而不是每门课分数都平均化的考试。举个例子，高考是不是还应该加入一些适应时代发展的新型课程，比如计算机考试，这样可以选拔少年计算机天才，然后降低其他分数。比如我喜欢中文，除了标准的中文考试，还有一门特殊的专业中文考试，它不是 150 分，而是 300 分。因为我这门课能考到 300 分，即便其他科目我考五六十分，也不影响我被北大中文系录取。当然这是一个的简单设想，如果你喜欢数学，那就考数学的 300 分；你喜欢生物，就考生物 300 分。这样我们从小培养孩子时，就知道可以往这个方向走。

在 AI 时代，教育的内涵正在被重新定义。梁建章指出，AI 工具的出现对人才提出了更高要求。未来的人才不仅需要掌握专业技能，还要具备跨学科思维、人性洞察力和快速学习的能力。“博学和快学”成为新时代的关键词，而不是机械地追求分数。

梁建章：我在《创新主义》那本书里的一个观点就是现在我们更需要博学和快学，而不要为了最后的几分拼命卷。七八十分就差不多够了，然后你要去学更多的学科。最后我们看企业的选择，企业到底需要什么结构的人才，或者研究生院需要什么样的创新型人才选拔？这就像自主招生，让市场决定究竟需要学什么知识。但总体来说，需要更快地博学，这是我对于 AI 和未来技能要求的理解。

家庭教育同样需要革新。两位专家强调，父母应该关注孩子的兴趣和个性发展，而不是将孩子置于过度竞争的环境中。俞敏洪更是提出了“大家庭”教育理念，鼓励家庭成员之间的互动和学习，通过丰富的社交体验来培养孩子。

俞敏洪：我小时候去旅行，就是我爸爸把我送上火车，去北京的叔叔家待一个暑假，跟表弟表哥玩一个暑假，这是非常好的。所以，上一辈的兄弟姐妹也很重要，暑假我去叔叔阿姨家玩，下一个暑假他们来我家这玩，互相轮转，这样就降低了成本，孩子也有很丰富的社交体验。因此，家庭要扩大，大国要大家，家庭教育需要更大的家。

旅行和见识世界被视为教育的重要组成部分。俞敏洪分享了自己每年带孩子游历中国和世界的经历，强调通过实地体验来培养孩子的好奇心和开放性。梁建章则建议家长给孩子创造自由探索的平台，让孩子在相对宽松的环境中成长。

两位企业家认为，孩子积极乐观的个性比学习成绩更为重要。一个充满好奇、敢于尝试、保持开放心态的孩子，才是未来社会真正需要的人才。

我最近一段时间的感受是：随着 AI 模型能力越来越强，很多原先能够带来差异化的技能现在都变得难以区分了。比如写作：遣词造句本来是小时候学作文很重要的一个技能，能够用更高级的词汇，更复杂的修辞手法，带来文字的美感；现在看，除非是极具文字天赋的少数人，大部分人最终写出来的东西也就是在 AIGC 的水平上下波动，不会带来真正的差异化。

而另一些技能变得更重要了，比如口头表达（speech），因为是一个实时的流式输出，目前还难以用 AI 来加持，所以变成有区分度的一件事情。理解这一点有两个契机：一是在美国，毕竟英语不是母语，在社交场合仍然会出现词不达意的情况；二是最近学习了解和孤独症相关的一些知识，发现一些人的确存在语言表达和社交上的障碍，比如不知道如何过渡到新话题，或者不知道如何解读其他人的表情神态。俞敏洪讲的“大国要大家”其实是针对现在的家庭规模普遍比较小的情况下，如何让孩子培养言语和社交能力的办法。

技术最终会大面积普及下去。教育占据了一个人成年前的大部分时间，如果教育机制不能因时而变，相当于浪费了所有人的青春。教育的核心问题在于能否个性化因材施教，如果教育不能突出人的区分度，那么培养出来的只能是给内卷的流水线输送更多的原料。梁建章讲“快学和博学”，其实是放弃掉了考试 100 分这种无所谓的要求，因为这些偏重记忆力和完美细节的部分最终还是要外包给 AI，不如在有限的时间里，通过广泛涉猎不同领域，搭建一个有差异化的知识结构来。

两个人最终都讲到了视野和乐观。这两件事情很可能是区分度最大的，也很考验家庭能提供给孩子的资源。视野宽广的好处在于更早的见识到不同的可能性，不管是宏大的，还是微小的，这样就不至于总是在一关打不过去的时候，看不到世界的全貌，在想法层面就把自己局限住了。乐观心态则意味着总是看到积极的一面，尝试新的可能性。这两点加起来，一个人就不会出现太大的问题。

← Back to Newsletter Archive