咱们继续讲丹尼尔·罗素的《搜索的喜悦》。作为搜索者,我们遇到问题的本能反应是上网搜索答案,但是我们也知道并不是所有问题都能在网上找到答案。
什么样的问题适合搜索呢?如果一个问题现在还是未解之谜,根本就没人知道答案,网上自然也没有答案。如果一个问题涉及到个人隐私或者国家机密,你也不会在网上找到答案。我们只能搜索到网上的公开信息,也就是所谓“公共知识”。
而作为一个高水平的搜索者,第一,你应该对自己有这样的信心:只要是网上有的,我就能搜索到答案。
第二,你还应该对互联网有信心:只要是公共知识,网上就有。
咱们说几个例子,看看罗素是怎么搜索的。
有一天,罗素的一个朋友给他发了下面这张照片 [1] ——
"朋友的问题是:拍摄这张照片的人,当时站在哪里?
照片中是一个城市里几个大楼的景象,这显然没啥可保密的,应该也算是公共知识,可是我们怎么搜索呢?
首先我要说的是搜照片有个简单技巧。搜索引擎都有个“以图搜图”功能,如果有人拿一张在网上出现过的照片给你,那你只要把这张图上传到搜索引擎,就能找到它曾经在哪里出现过,以及跟它看起来特别相似的图。这一招可以识破那些拿网上照片造假的人。
但罗素收到的这张照片显然是有人私下拍摄的,没上过网,我们只能从照片里寻找有用的信息。而罗素只用了五分钟就找到了答案。
罗素首先注意到照片左下角的墙上有一张看似是国旗主题的邮票,但他不知道那是哪国的国旗。罗素使用图片搜索“世界各国国旗” ——
[flags of the world]
得到各国国旗排在一起的图片,他识别出那是埃及的国旗。这里会不会是埃及呢?罗素搜索埃及首都开罗的图片,发现开罗市区的几乎每张图片上都能看到清真寺的塔尖,而这张图片里没有清真寺,非常不符合埃及的风格。这条线索断了。
罗素又注意到,图片的最上方的那个大楼上有个红色的 logo,旁边还有蓝色的 “tp” 两个字母。这是一个重大线索!罗素搜索 ——
[tp logo]
没有有用的发现。在这种情况下千万别气馁,要多试几个关键词。罗素又搜索“tp 办公楼” ——
[tp office building]
立即找到了下面这张图 ——
"这个楼显然就是照片里那个楼!而这个“tp”,其实是“波兰电信”在华沙的办公楼。根据这个信息,罗素立即找到了街道地址。至此问题就几乎已经解决了,你不用去一趟华沙,因为 google 已经拍摄了世界主要城市(可能不包括中国)的所有街道的街景。
罗素使用“google街景”和“google 地球”这两个应用定位在这座办公楼前,发现楼对面拍摄照片的地方应该是华沙金融中心的大楼。他再利用google地球的3d建模,根据拍摄的角度定位到拍摄者所在的高度,像下面图中这样 ——
"左边是原始照片,右边是 google 地球的3d建模
罗素判断拍摄者应该站在华沙金融中心大楼的十五层上下,那到底是哪一层呢?罗素又细看原始照片,波兰电信大楼的中间位置有几个蓝色的反光,好像是什么字 —— 罗素用 photoshop 把那几个字反过来,看着好像是 google —— 这时候他恍然大悟:拍摄者就站在 google 的华沙办公室里。
首先你得有工具。但是你也得有自己寻找关键词的能力,你要有探索的勇气,然后你还需要一点运气。
罗素曾经读过一篇写得很不专业的、纯属猎奇的文章,说有个湖爆炸了,杀死了很多人。后来他想起来,就想彻查一下这个事情 —— 毕竟湖居然杀人,这太离奇了。罗素已经不记得那篇文章的任何细节,他就简单搜索了“杀手湖” ——
[killer lake]
幸运的是第一个结果就是他想要的。原来说的是非洲喀麦隆的尼奥斯湖(lake nyos)。1986 年的一天晚上,尼奥斯湖突然爆发出大量的二氧化碳气体。二氧化碳比空气重,而且量实在太多了风吹不散,附近村庄的两千多个村民被陷入这些气体之中,因为缺氧,在睡梦中窒息而死。罗素了解了大量的细节,但是他马上又想到一个问题:这个爆发的原理是什么呢?怎么别的湖不这样呢?
当然罗素不是科学家,但是他很想知道大概是怎么回事儿。原来对于普通的湖,因为一年四季温度变化,上层的水和下层的水总会发生流动和混合;而对于尼奥斯湖这样在赤道附近的湖来说,因为常年温度没啥变化,基本上就是绝对的死水 —— 底层的湖水可能几百年都不会变动。而底层溶解了大量的二氧化碳。
而 1986 年这天,因为某种偶然的原因,比如说可能湖里掉进来一块大石头,导致底层湖水和上层湖水突然发生混合,底层湖水中溶解的二氧化碳随着压力减少就迅速变成一个大气泡从湖底浮上来,形成爆炸。
罗素在美国地质调查局(united states geological survey)的网站使用站内搜索 ——
[site:usgs.gov lake nyos]
取得了关于尼奥斯湖事件的官方说法。这使得他学到一个特殊关键词,原来这种现象叫“湖底喷发(limnic eruption)”。接下来搜索
[limnic eruption]
就得到了关于这一类现象的全面了解。浏览搜索结果的时候罗素注意到,华盛顿邮报的一篇报道说尼奥斯湖的湖底喷发把湖水激发出一个巨浪,以至于周围山上 80 英尺高的地方都留下了痕迹;可是杜克大学的一份报告说湖浪的痕迹高度达到了 80 米!那到底是 80 英尺还是 80 米呢?
这一次罗素使用了 google 学术搜索,找到一篇密西根大学地理系 youxue zhang(这显然是一位中国学者)的论文。这篇论文对尼奥斯湖做了一次数值模拟,模拟的结果的确是湖浪在山上的痕迹是 80 米高。而且论文还说,湖水喷射中心的最高高度达到了 300 米 —— 可惜当时没人亲眼看见。
至此,罗素从一篇非常模糊的猎奇故事出发,了解了真实的情况,明白了事情发生的前因后果,学到了一个学术专有名词,发现了主流媒体报道的错误,还听说了一个只有极少数科学家才知道的猛料。
在罗素之前,没有任何科普文章把尼奥斯湖杀人事件讲到这个程度。如果你不知道罗素是怎么做到的,你听他讲这个故事,肯定会为他居然知道这么多而感到震惊。
有一天罗素的女儿从外面带回家一朵花,而且还把花给吃了一半儿!那朵花是像下面这个样子 [2] ——
"罗素非常担心这花有没有毒!不过女儿看起来好像还挺正常,罗素没有贸然给有关部门打电话,他决定先搜索一番。这种户外随便能找到的野花有没有毒,肯定早就有人研究过了,肯定是个公共知识。
但是罗素不知道这花叫什么名!他有限的植物学知识告诉他这花应该是属于菊科(compositae family),可是菊科的花多了,不知这是哪一种。
但我们关心的是它有没有毒,所以罗素先看看有毒的菊科植物都有哪些 ——
[poisonous compositae]
搜索结果中,google 自动用了一个更专业的英文单词,asteraceae,代替了罗素输入的“菊科”,看来那个是更正规的说法。罗素找到美国食品药物监督局的有毒植物数据库,发现其中对有毒菊科植物的毒性描述都是“接触导致过敏” —— 这下他放心了,过敏不是啥大事,而且网站说大多数菊科植物都没有毒。
可是女儿吃的这个到底是什么花呢?罗素想到另一个线索,他家住在旧金山湾区,于是他搜索“旧金山湾区的野花”的图片 ——
[wildflowers san francisco bay area]
罗素挨个看了这些野花图片,发现其中有一种花,中文大概叫“海菲尔德焦油草(hayfield tarweed)”很像是他要找的。
搜索这个花的学名,罗素发现前三个结果都来自一个叫做 calflora.org 的网站,是加州大学伯克利分校的植物学家和美国森林管理局共同创办的一个有关加州的各种植物的数据库。这个来源显然是非常可信的……而在这个数据库里,植物学家说这种花不但没有毒,而且本来就是能吃的。
进一步的搜索发现,原来以前印第安人还专门种这种花来吃。
在这场搜索中罗素没有完全依赖搜索引擎的自动化处理。因为一开始不知道精确的关键词,搜索引擎返回的结果是一个很大的范围,罗素不得不用肉眼扫描所有的搜索结果,一个个判断是不是自己找的东西 —— 不过好在他可以只搜索图形,看图总比看文字描述快得多。
这种穷举法是搜索者常做的事情……搜索有时候也是体力活儿。
*
罗素随时都在搜索。其实我们也可以这样。出去旅游也好,平时路过哪个地方也好,看到不寻常的建筑物,拿出手机地图来就能知道那是什么。参观什么文物展览,你只要知道一个名字,就完全应该掌握比导游多的信息。
只要是公共知识,哪怕网上各处的专家都只知道它的一部分,我们也有信心通过调研,得到完整答案。
注释
[1] 我幸运地搜索到了这张照片的原图,来自罗素本人的博客:
https://searchresearch1.blogspot.com/2012/02/wednesday-search-challenge-feb-1-2011.html
[2] 这个搜索的博客原文我也找到了,
https://searchresearch1.blogspot.com/2013/08/answer-quickly-poisonous-or-not.html