Home

05/21/2023: Boring

本周的主题是 Boring 平淡。

缘起是在 Ben Thompson 的 newsletter 上读到:

This is why I think that Pichai’s “boring” opening was a great thing. No, there wasn’t the belligerence of early Google I/Os, insisting that Android could take on the iPhone. And no, there wasn’t the grand vision of Nadella last week, or the excitement of an Apple product unveiling. What there was was a sense of certainty and almost comfort: Google is about organizing the world’s information, and given that Pichai believes the future is about artificial intelligence, specifically the machine learning variant that runs on data, that means that Google will succeed in this new world simply by being itself. That is the best place to be, for a person and for a company.
在我看来,Pichai 的「平淡」开场是一件好事。不,不像早期的谷歌 I/O 那样咄咄逼人,坚称安卓能挑战苹果。也没有 Nadella 上周那样的宏伟愿景,也没有苹果产品发布会的兴奋。但是,我们感受到的是一种确定性和舒适感:谷歌致力于组织世界信息,而 Pichai 认为未来将以人工智能为主,特别是基于数据的机器学习,这意味着谷歌只需做自己就能在这个新世界中取得成功。无论是对个人还是公司来说,这都是最理想的处境。

确定性和舒适感,这两个词汇映入视线的时候,你有什么感觉?我相信大脑的新皮质已经开始工作,联想出许多与之相关的感官意象,无论是松软宽大的沙发,还是精致可人的料理,每个人的感受各不相同,但是殊途同归,我们都产生了类似的感受。

这种感受在 Thompson 的叙述中,也被和「平淡」感绑在了一起。每年一次的发布会,十年也不曾改变的愿景,已经构筑了坚不可摧的仪式。每一次的重复,如同是给古老的城墙漆上一层翻新的油彩。的确,过往的期待感来自于随时可能喷薄而出的意外感,可能是在某个排练多次的瞬间一次性抖落出来,让每个人目瞪口呆,而有转眼开始期待下一次的惊喜。

太久没有挑战者,或者是挑战者太久没有尝过哪怕小胜的喜悦。格局太过稳定,稳定到好事的媒体已经开始给这些发布会冠以「春晚」的名号,什么意思呢?是想表达它的隆重地位,还是像抱怨它的乏善可陈呢?

早在 2014 年,Google 就花费了 4 亿美元,收购了 Deepmind,而 Pichai 在七年前就把 Google 的公司战略定在了 AI first 上,同一时间,它发布了 Transformer 这个奠基性模型,也成为 GPT 等大语言模型的基础。谁知道,先发者未必先至,Google 在今年的 I/O 大会上,少见的扮演了一次追赶者的角色。

角色转换,反而带来了缺位已久的新鲜感。那种酸腐的平淡气味转眼就不见了,空气里弥漫着好斗者的躁动,四周围满了观众,和跃跃欲试的投注者。高风险和高回报又回到了我们面前,如同十几年前的某个夜晚,某些个年轻人曾经热血的讨论过的一样。

人们似乎总是想要摆脱平淡,而新鲜又只是那一瞬间。

王菲唱:

九月里来,平淡无聊。

我们将在本周的 newsletter 中探寻平淡和新鲜是如何交错生长在这个世界上的。

Essays

Why Chatbots Are Not the Future by Amelia Wattenberger

Amelia Wattenberger 是 GitHub Next 的 Principal Research Engineer,主要负责一些 AI/ML 的探索性项目。本文中,她分享了一些关于 AI/ML 用户界面上的思考。

作为一名有着用户界面设计背景的工程师,她意识到,一件好的工具是能够清晰地说明它们应该如何被使用的,以及更重要的是,不应该如何使用。

If we think about a good pair of gloves, it's immediately obvious how we should use them. They're hand-shaped! We put them on our hands. And the specific material tells us more: metal mesh gloves are for preventing physical harm, rubber gloves are for preventing chemical harm, and leather gloves are for looking cool on a motorcycle.
一双好手套,我们立刻就知道该如何使用:它们是按照手型设计的,我们把它们套在双手上;材质也告诉我们更多:金属网眼手套是防止身体受伤,橡胶手套是防止化学受害,皮手套是骑摩托车时看起来酷。

这些日常生活中的例子,是人赋予作为工具的物品了意义,这是具身性的一种体现:具身理论认为,我们全部的概念都深深依赖身体。理解这种第一人称视角极为重要,它意味着作为造物者的人类将如何赋予器物以意义和价值,也就意味着器物将被如何设计和创造。世界上本来不存在「手套」这样的器物,是人类创造了它,并让它和人手具有相似的形状。在这个意义上,工具本身就被设定为人的官能的延伸,它从来都不是自然的一部分。

而在 AI 进化到了 LLM 这个阶段的时候,需要大量文本输入的 ChatGPT 出现了。在起初的惊喜过后,我们现在应该都开始意识到,prompt 输入本身也是一件重复性很高的劳动,特别是当我们想要得到符合预期的回复的时候。我们终归只有十个手指,而且打字本来就是一件极其容易出错的事情。这时,工具开始演进,比如,大部分利用 OpenAI 的 API 进行套壳开发的客户端产品都开始预设常用 prompt,后者允许用户储存自定义的 prompts,特别是结合自身的使用场景,比如 Notion AI 和 Raycast AI 分别在笔记和桌面启动器两个场景中,赋予了用户更多的快捷操作的可能性。

Wattenberger 意识到,prompt 实际上是在提供问题解答的上下文,而对于给定的某个用户而言,能够定义某个上下文,需要对常见问题做抽象和归纳。

LLMs make it too easy: we send them text and they send back text. The easy solution is to slap a shallow wrapper on top and call it a day. But pretty soon, we're going to get sick of typing all the time. If you think about it, everything you put in a prompt is a piece of context.
自然语言处理技术使得操作变得太容易:我们发送文本,它们就会发回文本。最简单的解决方案是在上面加一层浅层的包装,就完事了。但是很快,我们就会厌倦不断地输入文本。如果仔细想一想,每一个放在提示中的部分都是上下文

上下文(context)介于兴趣(interest)和意图(intent)之间,前者是被动发现,后者是主动搜索,而上下文则是在主动向被动延伸的过程中的过渡。就像人类的对话,一开始设定了某个主题,但后来就会聊着聊着开始发散,最终不知道会游移到什么地方去。正是这种宽泛让 LLM 的回答突破人类对机器智能的固有认知,发现它能做出合理的联想。这需要「恰到好处」,不至于像「兴趣」一样过渡泛化,也不至于在「意图」中死死纠缠。

LLM 和过往出现的自动化(automation)并不相同,因为 context 的尺度拿捏存在一定的不确定性。即便是 AI 做到了与人等价的思维能力,也无法预见,对话中是否会出现离题太远而彻底失控的情况(现实中,这种情形大量出现在人类对话中)。Wattenberger 写道:

Automating tasks is going to be amazing for rote, straightforward work that requires no human input. But if those tasks can only be partially automated, the interface is going to be crucial.
自动化任务将对不需要人类输入的简单、死板的工作产生惊人的效果。但是,如果这些任务只能部分自动化,界面就变得至关重要了。

我相信,Chatbots 一定不是 LLM 主要的消费者使用界面,它会在层层包装后,以一种更加符合人类生理或心理习惯的方式出现。这或许意味着人类对于机器的最后的权力。

与以往所有的器物都不同的是,我们对于机器输出的精确控制正在减弱,复杂系统内生的涌现性正在替代机械,用户可能会碰到一些开发者无法预料的情况——在过去,这被称为 bug;而在未来,这或许需要一句真诚的道歉——来自机器的。

Fertility Collapse Demands New Cultures by Malcolm & Simone Collins

本文讨论了在全球生育率大幅下降的时代,人类需要一种什么样的社会文化。

首先,生育率低到什么程度呢?南韩目前的总生育率为 0.81,每 100 名南韩祖父母将有 6.6 个曾孙,到 2024 年预测的 0.7 的生育率,曾孙人数只有 4.3 个。这就好像知道一种疾病会在未来一个世纪内杀死南韩 94% 的人一样。

其背后的原因不单纯是养育后代高昂的财务代价,文章认为,要让人们养育 2 个或以上的孩子,必须至少满足如下几个原因中的一个:

  1. 如果每个孩子都能显著提高家庭的经济前景;
  2. 如果家庭缺乏使用节育有效的教育,或者处于节育不可能的情况;
  3. 或者如果有某种文化因素促使他们要生很多孩子。

生育率崩溃产生的后果是严重的。现代经济的基本假设是增长,而这种增长无论是在生产还是消费侧,都依赖于人口的增长。养老基金的回报、房地产的价值、长期债务问题,在生育率下降的前提下,人口减少甚至可能会导致财富急剧减少,并引发连锁违约。我们在底特律看到了这种情况,底特律在过去60年里人口减少了 40%。

作者甚至这样写道:

Our entire civilization has been built like a Ponzi scheme that requires constant growth. That scheme will eventually collapse.
我们的整个文明是像一个旁氏骗局一样建立的,需要不断增长。这个骗局最终会崩溃。

AI 的降临,或许可以作为一个不像人类那样消耗的生产者,但它也同时造成了一些其它后果,比如:人类劳动者的协作关系(见 AI 杂记 4 中写到的 software layer 概念)可能会被破坏。

谈及现代社会的文化,作者写道:

Our economy is structured in a manner that organically identifies and maximally utilizes talent to create short-term marginal productivity. The system differentially sorts for the most potentially productive among us, and then offers them money and status to forgo other life activities that don’t create immediate productivity.
There is little that draws a person away from immediate economic productivity more than a social lifestyle compatible with good matchmaking, strong family ties, and child rearing. No one gets financially rewarded in our current system by structuring cities in a way that invites the creation of large families. In fact, many will be punished if this pressure exists by local companies having less worker time, for example. For this reason, the centers of productivity in a modernized economy will intrinsically be suboptimal environments for raising large families.
Worse still, because the system we have built differentially feasts on the most productive and prosocial people and culturally castrates them, it unsustainably consumes human capital.
我们的经济结构以一种有机的方式识别并最大限度地利用人才来创造短期边际生产力。该系统差异性地为我们当中潜在最有生产力的人排序,然后提供金钱和地位,以放弃不会立即产生生产力的其他生活活动。
在我们目前的系统中,没有什么会把一个人从即时的经济生产力中拉出来,比一个与良好的婚姻匹配、家庭关系紧密、抚养孩子的社会生活方式更多。没有人会因为以这种方式组织城市而在我们目前的系统中获得财务回报,如果存在这种压力,当地公司的工作时间会变少,例如。因此,现代化经济体中的生产中心本质上不是抚养大家庭的最佳环境。
更糟糕的是,由于我们建立的系统差异性地捕食最有生产力和互惠主义的人,并在文化上阉割他们,它在不可持续的消耗人力资本。

这段控诉是很有力的。它指出了现代社会中对边际收益的痴迷所带来的对人力资本的掠食性消耗。文中还用到了 castrate 阉割一词,血淋淋的真实,在社会和文化意义上丧失生育欲望是碳基文明的窘境。

The Personalization Wave, a Surge of Wildly Human-Intensive Non-Scalable Experiences, & Ideas of the Month by Scott Belsky

Adobe 的首席产品官 Scott Belsky 发表了一篇他对 AI 驱动的个性化产品浪潮的预判。

个性化这个词并不时髦,甚至于在对「监视资本主义」的反对声中,显得有点负面。Belsky 的看法是:

it takes us back to the way things once were - the ancestral comforts we long for - but with more scale and efficiency.*** In the ancient world of small tribes and towns, we were known. We long for the days when our local storekeepers greeted us by name and our neighborhood restaurants remembered our likes and dislikes. We want to be welcomed, served, and remembered for who we are - and valued for our loyalty. For example, I’d be fine with every restaurant in the world knowing that I am a vegetarian. I’d be fine with every e-commerce store knowing that I wear a size 9.5 mens shoe. However, I want to know HOW they know this information. I don’t want my data to be sniffed or scraped, I want control.
它(个性化)会成为我们回归传统的路径 - 我们所渴望的祖辈的舒适感 - 但更有规模和效率。在古代的小部落和城镇中,我们彼此熟知。我们渴望着,当地商店老板以我们的名字打招呼,邻里餐厅记住我们的喜好时的日子。我们希望受到欢迎,得到服务,并且因为我们自己而被记住 - 并且因为我们的忠诚而受到重视。例如,我很乐意每家餐厅都知道我是一个素食者。我很乐意每家电商网站都知道我穿 9.5 码的男士鞋子。然而,我想知道他们是如何知道这些信息的。我不希望我的数据被嗅探或抓取,我想要控制权。

显然,比起 LLM,过去的个性化都显得简单粗暴,近乎于是机械式的暴力破解。

We became "logged out" visitors in all parts of our lives, greeted with generic menus and generalized calls-to-action. Today, we experience the lowest common denominator of digital experiences on a daily basis, and are oblivious victims of data collection and retargeting campaigns. All this, despite the fact that brands thrive or die based on conversion and retention.
我们变成了每个领域的“登出”访客,受到普通菜单和普遍行动的迎接。如今,我们每天都经历最大公约数的低级数字体验,并且是数据收集和重定向活动的无知受害者。尽管品牌的兴衰取决于转化率和留存率,但这一切仍然如此。

谈及基于 AI / LLM 构建个性化的护城河,Belsky 以投资人视角提供了 3 个维度:

  1. 有没有独特的数据集或者对数据集的独特理解?
  2. 有没有重要的分销优势或最终优势?
  3. 有没有革命性的界面优势?

对于第一点,他认为:非可移植性数据将是最终的护城河。他引用 CtrlStack CEO Dev Nag 的话说:

Proprietary data that is not portable can be a leverage point for training models with superior performance -- examples would be user click data, user prompt history, even instrumented system data that's not visible to (or charged to) customers. I predict that we've hit peak openness on the web, and we're going to see a retrenchment into more private data over the next few years as people realize how much of their public work can be easily co-opted by transformer-based models.
封闭的数据不能够轻易移植,却可以成为训练出优异表现的模型的杠杆,比如用户点击数据、用户操作历史记录,甚至是对客户不可见的系统数据。我预言,网络的开放性已达到顶峰,接下来几年,随着人们意识到基于 Transformer 模型可以轻松地挪用公开的工作,私有数据将会卷土重来。

人类需求的本源来自于稀缺性(经济学 101),我们天生想要难得一见的体验。Belsky 回忆他在日本京都旅行时的体验,料理中的器皿和食物,每一步都有刻意安排的独特性。他问道:要提供这样的需求,新的供给在哪里呢?

The Maze Is in the Mouse by Praveen Seshadri

本文是 Google 前员工 Praveen Seshadri 讲述 Google 内部组织文化变化的一篇文章。和开头 Ben Thompson 的引文有一些呼应。

以下是一些要点总结:

是不是感觉很熟悉?清晰度会在规模面前失色,无论最开始的文化和价值观多么强悍——我觉得应该有系统论的视角来解释这一现象,它简直就是组织的宿命论。

Shortform

@patrick_oshag:

We will all have a stable of personalized AI agents (with their own personalities) that we deploy for a variety of tasks They’ll be connected to public and private personal data sources They’ll be highly interactive like other human agents, and use interactions and feedback to hone in on your preferences I think we will all have a personalized:

- travel agent (helps suggest and book perfect trips)
- security agent (helps you manage digital and personal and physical security)
- scheduling agent (helps you manage your schedule)
- food agent (helps manage inventory, suggest and track recipes, order food, etc)
- romantic agent (helps manage dating life)
- social/experience agent (helps make life fun)
- medical agent (helps optimize lifespan)
- longevity agent (helps optimize healthspan)
- investing agent (both simple portfolio management and complex security analysis)
- marketing agent (helps you distribute ideas, create memes, run campaigns, etc)
- writing agent (writing co-pilot)
- business intelligence agent (helps present most critical business intelligence in your organization)
- software agent (helps you write custom software for yourself)
- content agent (helps serve you the perfect content across channels and mediums)

Probably many others… Lots of these may be combined, but I do think we’ll have multiple agents with different perspectives and training They’ll all constantly get better as models improve, as data sources come online, and as they learn you via feedback which gets incorporated into the model. This seems inevitable to me. Why is that wrong? What companies are already doing this? If you want to build something in this space (or already are) let me know.

Patrick OShaughnessy 列举了一长串 AI agent 的可能性(或许不是他本文写的)。Agents 和 Assistants 有什么区别?这些角色是否会成为每个人日常生活中都存在的角色?

Longform

本周继续在读《自卑与超越》。

这本书的重要观点在上一次 newsletter 中写到过,最关键的假设,就是人和人之间的互相依赖。人类漫长的未成年期,注定了父母和家庭对我们的深刻影响;而在成年之后,也需要迅速融入社会分工中,扮演自己的角色。而很多人会在自我和世界之间往往会彷徨不知所措,最终体现为各种各样的自卑情结。

书中这样定义自卑情结:

我们可以这样来为自卑情结下定义:如果在面对一个棘手的问题时,一个人感觉自己无能为力,由此产生的情绪就叫作自卑情结。 我们从中可以看出:自卑情绪会有很多表现形式,比如眼泪、愤怒、歉意等。因为自卑感会让一个人感到焦虑,因此,他就会寻找优越感来补偿自己的情绪,但是,这样做的目的并不是解决问题,而是将真正的问题掩藏起来。于是,他的活动受到了限制,他会致力于如何避免失败,而不是努力解决问题。困难所带给他的只剩下彷徨、犹豫和退却了。

这样看,这种情结普遍在我们身上存在,它最大的后果就是影响我们把自我和世界连接起来,外界不知道如何和我们沟通合作,我们也很难走出自我的藩篱。

心理学的书很多都会配上大量的案例,这本书的好处在于,案例可能就在你自己身上。

← Back to Newsletter Archive