Home

08/22/2021: Baseline

本周的主题是 Baseline 基准。

Forewords

最近在比较一些能够更好的监测心率的运动手表。这个分类里面的金标准是 Garmin,只要你稍稍做一些研究,就能发现这个在大众中名气并不算响亮的牌子在很多评测中已经成为基准,所有的品牌——甚至包括 Apple Watch——都会被拿来和它做对比。

这是一个巨大的优势:它让 Garmin 从不必要的自我辩白中豁免出来。而其它的竞品则必须解释为什么自己的监测数据和基准之间出现了差异。竞争到了这个程度,已经完全不公平了——没有人想要把自己置于一个要和最大的竞争对手对比的境地,更何况这个对比已经成为一个基准测试。

成为基准并不容易。就用我最看重的心率监测来举例子。光电心率监测的原理是:

当光照射到皮肤上时,一部分被吸收,一部分被反射,当心脏搏动时,动脉血在血管中的流速呈现与心跳周期相同的周期运动,引起反射光强度的周期变化。 光电发射器发射光束到皮肤上,经过皮肤反射,由光电接收器接收,根据反射光强度的变化趋势,就可以得到心跳的周期和频率。(来源

一般认为,在人体处于剧烈运动、心率变化较快的时候,戴在手腕上的手表监测到的数据是不太准确的。绑在胸部的心率带则被认为是更加准确的一种计量方式。而 Garmin 经过多年的努力,通过不断改进传感器和软件算法,让手表的心率监测功能越来越逼近心率带(当然,对于很多专业选手,仍然不够准确),逐渐成为了行业基准。

还有一个国货品牌叫做 Coros 高驰,近来势头很猛。它最大的特点是电池续航特别长,轻松达到数周甚至数月的级别。对于用过一天一充的 Apple Watch 的人而言,这个续航显然是惊人的。加上这个牌子外观设计出色,性价比更高,我也认真考虑过。但它在心率监测的「基准」测试中却败下阵来。我看了一下测试对比数据,发现它很可能在监测运动心率的时候,用了较低的采样率,因此导致数据是阶梯状跳动的。这样,数据会更加滞后,但电池续航却可能因此变长。

很多人可能会有和我一样的第一反应:这是在不起眼的地方偷工减料,电池续航是很多人更容易注意到的性能,而心率数据是否准确则不是每个人都有概念的。抱怨数据问题的用户往往是具有更多运动经验的,他们对自己在不同运动强度下的身体状态更了解,因此可以凭借直觉直接做出判断。而电池续航呢,则很容易出现在京东淘宝的好评区中。

我的第二个想法是,这可能是一种有意的选择。在竞争处于下风的时候,用差异化且更容易感知的特性来挑战,是合理且常用的手段。续航时间长,和马拉松、越野跑以及户外探险结合在一起,成为 Coros 产品线上更明确的——也是更聪明的——标签。

然而,Garmin 仍然是这个细分领域的王者,以更高的价格,占有更大的市场,并保有基准的地位。

在上周读过的 Framers 一书中,作者 Kenneth Cukier 指出了框架(frame)在人类认知中的地位:

Framing—capturing some essence of reality through a mental model in order to devise an effective course of action—is something humans do and machines cannot.
As humans, we cannot not frame. We can’t switch it off; we frame all the time. The only choices we have are what frame we use and how well we use it.

人类不可能逃离框架。框架高于现实,而成为人类认知的界面。而基准就是框架的一种。当人们把一种现实默认为是基准的时候,并非是接受了这种现实,而是选择了自身认知界面选择性接收新信息的标准。这像是一层滤镜,人们必须透过这层滤镜观察和理解世界,却可能不知道它的存在。

毕竟,很少有人会考虑基准自身存在什么问题,或者是在什么时候,应该把它换掉。

附:一篇知乎上对两个品牌定位的分析

Links + Notes

Testifying at the Senate about A.I.‑Selected Content on the Internet by Stephen Wolfram

作者接到了美国国会的邮件邀请,去参加一场关于 AI 选择内容的听证会,主题包含了:

“The hearing is intended to examine, among other things, whether algorithmic transparency or algorithmic explanation are policy options Congress should be considering.”

也就是算法的可解释性。

在 Framers 一书中,作者认为框架是人类和机器认知模式最大不同。正因为这样一点差异,机器算法很难被人类轻松的解释。人类认知框架中内含的因果性、虚构性和限定性(Causality, Counterfactuals and Constraints)为机器所不能,而机器从混沌中计算出来的东西,很多情况下,也仍然是一坨混沌。

而现实情况是,对于受众广泛的平台而言,这种混沌似乎是可行的次优解法。它们业务模式的本质是。automated content selection 自动内容选择,而选择出来的内容的主要目的是吸引受众,而非真正服务他们。

如 Wolfram 写到的:

It doesn’t help that in some sense the AIs are getting much more free rein than they might because the people who use them aren’t really their customers. I have to say that back when the internet was young, I personally never thought it would work this way, but in today’s world many of the most successful businesses on the internet—including Google, Facebook, YouTube and Twitter—make their revenue not from their users, but instead from advertisers who are going through them to reach their users.

因此,越来越难以区分 AI 和媒体是不是其实就是一件事,主要原因是前者越来越广泛的渗入到媒体和内容中,而且很难确认其渗入程度的深浅程度。而 Wolfram 接受的邀请就是试图撇清边界。

Wolfram 试图用 Computational Laws 来解决问题。这意味着把律师们擅长的语言变换成机器更容易理解的代码。代码实际上是中间地带,是人与机器可以产生对话的共有语言。在此基础上,人类可以为机器设定和描述目标,而且这种描述是可以被人类理解和解释的。

至于如何达到目标,则重新回到黑盒的状态。机器闷声不响的完成内部的计算,并最终吐出一个结果。人类可以做的,是用当初设定的目标来检验结果是否满意。这种沟通方式是实验式的,实验结果并不稳定,但在工业界,这是可以接受的。

Wolfram 提出几条公理式的断言:

Computational Irreducibility: Even given every detail of a program, it can be arbitrarily hard to predict what it will or won’t do
Non-explainability: For a well-optimized computation, there’s not likely to be a human-understandable narrative about how it works inside
Ethical Incompleteness: There’s no finite set of principles that can completely define any reasonable, practical system of ethics

这些原则无疑为机器驱动的平台创造人类视角的叙事增加了难以估量的难度。

为了避免黑盒模式造成利益冲突,Wolfram 建议了一种「三权分立」式的模式:

One of my ideas involved introducing what I call “final ranking providers”: third parties who take pre-digested feature vectors from the underlying content platform, then use these to do the final ranking of items in whatever way they want. My other ideas involved introducing “constraint providers”: third parties who provide constraints in the form of computational contracts that are inserted into the machine learning loop of the automated content selection system.

也就是说,内容的排序规则、限制条件由不同的供应商来完成。在平台内部,这种组织结构很可能造成巨大的「效率」损失。做出什么样的机制选择取决于如何定义效率框架。

第三方提供排序规则
第三方提供限制条条件

平台内在的网络效应追求自然垄断,但作者设想,算法是否可以有多种选择,满足不同需求。这个设计无疑也会造成平台经济效率的损失。这种开放模式,实际上让平台变成了协议,一旦损失了对内容选择的独家权力,平台将损失大量的利润,从而变成管道。

原文比较长,还包含了作者在听证会上发言的全文,这里不再展开。对于平台经济的监管还需要相当一段时间才能全部展开,在这个过程中,人们开始反思过去的金色故事是否太过于精彩,以至于不是真实的。监管,而不是市场,的力量在觉醒,这真是一堂不能错过的政治经济学课。

本文发表于 2019 年 6 月。

On the Origins of the Emotional Support Peacock by Wesley Yang

这篇文章描述了一个几乎可以拍成电影的故事(至少从我的角度来看)。

一位名叫 Holcomb 的黑人男性起诉了美国航空,称自己被驱逐出了航班,尽管他购买了头等舱的机票。而美国航空方面的证词则表示,是因为当时头等舱有另一位白人女性乘客,随行携带了一只用于情感支持(Emotional Support)的狗,引起了 Holcomb 的过敏症状;空乘人员试图协调座位,并愿意补偿从头等舱调整到经济舱的差价,仍然未能成功。为了尽快平息冲突,只能将 Holcomb 请下了飞机。

这个戏剧性场面可能还有很多隐情。但媒体很快为这个事件套上了种族问题的框架。标题是:A Dog’s Mess: Black Man Suing American Airlines for Being Kicked Off Plane So Pooch Could Fly First Class。这个叙事完全把那只狗的本来角色「情感支持」排除在外,而放大了「黑人与狗」之间的选择。

所谓「情感支持」动物和宠物不同,经过律师、医生和游说团体的推动,在美国已经成为一项不可或缺的个人权利。有人宣称自己的情感支持动物是一条蛇,因为幼年时期曾经在溺水之际抓住过这么一种大部分人都会害怕的动物,在医生的证明下,这条蛇就可以被带上飞机。另外一个例子是,学生被允许在考场中携带自己的情感支持动物,而不考虑这种动物是否会对其他人造成不利影响。

作者的问题在于:

法院和官僚机构依靠临床医生的诚信来定义疾病,而临床医生的权威又来自于认证机构,这些机构认证了我们社会中的知识。如果形成知识的机构本身被教派的权利概念和扩张性的主观伤害概念所俘获,而这种伤害的存在只能通过自我报告来确定,那么会发生什么?

这段话使用了「知识」一词,而溯源而上后,你会发现这其实是一种主观判断,只是经由社会中的若干权力机构的认证,就变成了被广泛认可和法律保护的「知识」。在上面的几个案例中,不难看到,「知识」就意味着权利,足以影响他人所处地位的权利。

依据判例来构建广泛使用的机制,往往会在后续实施中碰到类似案例:适用范围被人为放大,判决结果被用作其它目的。

The Danger of a Single Story by Chimamanda Ngozi Adichie

这是 2009 年的 TED 演讲。在国内的视频平台上也可以搜到一些搬运的版本。

演讲者是来自尼日利亚的女作家 Adichie,她以个人经历的几个故事来讲述单一叙事的危险。

第一个故事来自于她在童年阅读的英美图书。在那些书中,主人公都拥有白皙的皮肤,谈论天气,开车出门。在七岁时,她也开始学会写作,在她的作品中,主人公也是类似的人。很长一段时间,她认为非洲人不应该出现在书中,书中的人物的情节就应该是关于非洲之外的世界的。

第二个故事来自于她家里的男仆 Fide。Adichie 的家庭在当地处于中产阶层,她的母亲不断教诲她 Fide 的家庭非常贫苦,把家中的旧衣服赠送给 Fide。后来有一次,Adichie 去往 Fide 家里,发现 Fide 的妈妈拿出一个编织非常精美的篮子,她才意识到除了贫苦之外,Fide 的家庭还有其它值得讲述的故事。

第三个故事发生在她 19 岁那年前往美国去上大学。她的美国室友见到她以后,就开始询问非洲部落音乐、战争和饥饿的情况。当她说自己听 Mariah Carey 的音乐时,室友感到非常惊讶。这种惊讶,就像当年 Adichie 看到 Fide 家里的精致篮子一样。

在 Adichie 的经历中,非洲被赋予了单一叙事。这种叙事也是一种认知框架,牢牢的把人们讨论的主题限定住了。Adichie 说,如果你有几个点要表达,不妨从第二点开始讲,这样就能避免单一的、刻板的叙事。

的确,当我们听到第一、第二、第三的时候,往往只会记住第一点。第一点设定了故事的基线,第二点和第三点无非是第一点的补充和重复。这样,故事的后续发展总像是令人惊讶的反转,而实际上,这只是我们认知选择的结果。

我为什么会沉迷黑帝斯 by 游戏篝火

黑帝斯 Hades 是去年获奖无数的一个游戏,最近因为登录了 Xbox 和 PS 主机而再一次获得广泛关注,本文总结了来自多个媒体的观点,解释为什么这个看起来画面十分复古的游戏为什么如此让人上瘾。

游戏采用了一种叫做 Roguelike 的游戏机制。引用维基百科的定义:

Roguelike 是角色扮演游戏的一个分支类型,它以一系列随机生成关卡的地牢、回合制战斗、基于磁贴的图像(tile-based graphics)和角色永久死亡(即一次游戏内无法无限制复活)为特点。维基百科

Hades 也不例外。它采用了希腊神话中的众神设定,玩家会扮演扎格列欧斯,想逃离父王(冥王黑帝斯)的控制,逃离冥界。在一次又一次的战斗中,主角会不断的死亡而又重生,再一次遭遇随机出现但又难度适宜的敌人。同时,每一次重生之后,玩家将可以解锁更加强大的武器和技能,让战斗组合变得更加多样。

这个游戏不仅仅只有这些看起来很重复的打怪升级。每一次重生之后,通过和 NPC 的对话,主角将开始揭示他的身世故事,他一次又一次的逃脱计划被赋予了新的意义:寻找自己的生母。

我并不是一个重度的游戏玩家,也不得不说,这是一个容易让人停不下来的游戏。故事线索的展开如同一条暗线,在打打杀杀的爽快之外,增加了玩下去的乐趣。用故事塑造英雄,而英雄的旅程一定要充满意义,这是亘古不变的神话。

这个游戏的硬件要求不高,应该在一台普通的笔记本上也可以运行。

Speed Bumps by Seth Godin

Seth Godin 找到了一个形象的比喻:减速带。他说:

减速带和障碍的唯一区别是我们决定它是什么。

再一次的,这又是一个框架的问题,或者回到本周的主题:基准。

之前的一个周末,滚烫的夏日下午,很多车在路上堵着。突然,一辆 SUV 从隔离带上横着穿过来,高大的底盘轻而易举的跨越了半尺多高的隔离带,从一条拥堵的车道开到了另一条空旷的车道上,然后趁着绿灯,轰着引擎绝尘而去。

这个场景在一旁看,是很骇人的。在城市里,基准设定是大家在车道上蠕动,抓准机会插个队,就已经很不错了。越是拥堵密集的城市,转向灵活的小型车辆就越受欢迎。在北美畅销的那些大家伙无处撒野。

而在刚刚那个场景下,隔离带和减速带又有什么区别?城市和野外又有什么区别?

Tweets

@coldjerky:

OnlyFans banning sexually explicit content is like Hogwarts School banning magic.

OnlyFans 本周的一则打击色情内容的声明在不同的群体中引发了热议。有人说,这是走了 Tumblr 的老路。有人说,创作者要联合起来,反对中心化平台的剥削。

各自有各自的立场,而基准是:魔法不会消失,只会在其它地方冒出来。

Books

本周继续读了 George Lakoff 的《别想那只大象》。这本书我给了 5 星推荐的好评。

George Lakoff 也是一名语言认知学家,专注于研究人类如何通过理解语言和建立认知。这本书和前面读过的《我们赖以生存的意义》以及开头提到的《Framers》都是这个分类主题下的著作。《我们赖以生存的意义》中也明确提到了本书,这也是为什么我会找到这本书来读。

「别想那只大象」的书名,顾名思义,就是说只要你听到这句话,脑海里就会出现大象的形象。类似的例子在《我们赖以生存的意义》中也出现了(只不过用的北极熊的例子)。这意味着,人类的认知极其容易被框定,尽管被认为是一种认知系统上的缺陷,但它也为解构和掌控创设了条件。

这本书更广为人知的价值在于,它是一本政治宣传和竞选指南。作者自身是「进步派」,但他认为「保守派」更善于利用和操纵认知,设定框架;而「进步派」则陷入了无休止的回应一系列具体议题上,掉入了对手设定的框架,而不自知。

一个被反复提到的例子是:全球变暖 vs. 气候变化。「保守派」成功的在公众话语体系中用后者替代了前者。显然「气候变化」更加中性,更不会引发广泛的担忧和后果推断,也更有利于「保守派」的一系列竞选策略。

George Lakoff 写作了一系列相关主题的著作,我还在继续阅读他的《道德政治》。

这一系列的语言认知领域的阅读,将成为本月付费通讯的基底。它会和最近的几篇付费通讯连起来,形成关于「共同想象」的一个系列。这个系列目前至少包含 3 篇文章:

预计在下周完成并发出来。

敬请期待,

Neo

← Back to Newsletter Archive