重建世界/信息DNA 比特和原子
要了解“数字化生存”的价值和影响,最好的办法就是思考“比特”和“原子”的差
异。
虽然我们毫无疑问地生活在信息时代,但大多数信息却是以原子的形式散发的,如报
纸、杂志和书籍(像这本书)。
我们的经济也许正在向信息经济转移,但在衡量贸易规模和记录财政收支时,我们脑海
里浮现的仍然是一大堆原子。
关贸总协定(GATT,GeneralAgreementonTariffsTrade)是完全围绕原子而展开的。
最近,我参观了一家公司的总部,这家公司是美国最大的集成电路
(integratedcircuit)制造商之一。
在前台办理登记的时候,接待员问我有没有随身携带膝上型电脑(laptop)。
我当然带了一部。
于是,她问我这部电脑的机型、序号和价值都是怎样的。
“大约值100万到200万美元吧!”
我说。
她回答:“不,先生,那是不可能的。
你到底在说什么呀?让我瞧瞧。”
我让她看了我的旧“强力笔记本”(Power-Book)电脑,她估计价值大约在2000美元
左右。
她写下了这个数字,然后才让我进去。
问题的关键是,原子不会值那么多钱,而比特却几乎是无价之宝。
不久前,我在加拿大不列颠哥伦比亚省的温哥华(Vancouver)参加了一次宝丽金公司
(Po1yGram)高级经理人员的管理研习会。
这次会议的目的是促进高级经理人员之间的沟通,同时让大家对公司未来一年的计划有
一个整体概念,因此展示了许多即将发行的音乐作品、电影、电子游戏和摇滚乐录像带。
他们委托联邦快递公司(FederaIExpress)把这批封装好、有重:量、占体积的CD
盘、录像带(videocassette)和只读光盘(CD)送到会场来。
不幸的是,部分包裹被海关口了下来。
信息高速公路的含义就是一光速在全球传输没有重量的比特。
当一个个产业揽镜自问“我在数字化世界中有什么前途”时,其实,它们的前途百分之
百要看它们的产品或服务能不能转化为数字形式。
如果你制造的是开司米羊毛衫或是中国食品,那么要把产品转换成比特,就还有很长的
路要走。
要像《星际旅行》(StarTrek)的剧中人一般,随时化为光束消逝,虽然令人神往,但
恐怕几百年内部不可能实现。
因此,你还是得靠联邦快递、自行车或步行,把原子从一地送往另一地。
这并不是说,在以原子为基础的行业中,数字技术在设计、制造、营销和管理方面,都
将毫无用武之地。
我只不过是说,这些行业的核心特点不会改变,而且其产品中的原子也不会转换成比
特。
在信息和娱乐业中,比特和原子常常被混为一谈。
书籍出版商到底属于信息传输业(传送比特),还是制造业(制造原子)呢?过去的答
案是两者兼跨,但是当信息装置越来越普遍而易于使用时,这一切将很快得到改变。
现在信息装置还很难(尽管不是不可能)和一本书的品质竞争。
书籍不仅印刷清晰,而且重量轻、容易翻阅,价钱也不是太、贵。
但是,要把书籍送到你的手中,却必须经过运输和储存等种种环节。
拿教科书来说,成本中的45%是库存、运输和退货的成本。
更糟的是,印刷的书籍可能会绝版(outofprini)。
数字化的电子书却永远不会这样,它们始终存在。
其他媒介面临的风险和机会更是近在眼前。
第一批被比特取代的娱乐原子将是录像带出租点中的录像带。
租借录像带有一点很不方便,就是消费者必须归还这些原子,如果你把它们随手一塞忘
了归还,还得付罚款(美国录像带出租业120亿美元的营业额中,据说有30亿来自罚
款)。
由于数字化产品本身的方便性、经济上的强制驱动和管制解除等因素的共同作用,其他
媒体也会迈向数字化,而且其速度将会很快。
比特究竟是什么?比特没有颜色、尺寸或重量,能以光速传播。
它就好比人体内的DNA一样,是信息的最小单位。
比特是一种存在(being)的状态:开或关,真或伪,上或下,入或出,黑或白。
出于实用目的,我们把比特想成“1”或“0”。
1和0的意义要分开来谈。
在早期的计算中,一串比特通常代表的是数字信息(numer-ica1informadon)。
假如你数数的时候,跳过所有不含1和0的数字,得出的结果会是:1,10,11,100,
101,110,111,等等。
这些数字在二进制中代表了1,2,3,4,5,6,7等数字。
比特一向是数字化计算中的基本粒子,但在过去25年中,我们极大地扩展了二进制的
语汇,使它包含了大量数字以外的东西。
越来越多的信息,如声音和影像,都被数字化了,被简化为同样的1和0。
把一个信号数字化,意味着从这个信号中取样。
如果我们把这些样本紧密地排列起来,几乎能让原状完全重现。
例如,在一张音乐光盘中,声音的取样是每秒44100次,声波的波形(waveform,声压
的度数,可以像电压一样衡量)被记录成为不连贯的数字(这些数字被转换为比特)。
当比特串以每秒44100次的速度重现时,能以连续音重新奏出原本的音乐。
由于这些分别取样的连续音节之间间隔极短,因此在我们耳中听不出一段段分隔的音
阶,而完全是连续的曲调。
黑白照片的情况也如出一辙。
你只要把电子照相机的道理想成是在一个影像上打出精密的格子(grid),然后记录每
个格子的灰度就可以了。
假定我们把全黑的值设为1,全白的值设为255,那么任何明暗度的灰色都会介于这两
者之间。
而由8个比特组成的二进制位组(称为一个字节,即byte)就正好有256种排列“1”
和“0”的方式,也就是从00000000到11111111。
用这种严密的格子和细致的明暗度层次,你可以完美地复制出肉眼难辨真伪的图像。
但是,假如你采用的格子比较粗糙,或是明暗度的层次不够精细,那么你就会看到数字
化的斧凿痕迹,也就是依稀可见的轮廓线条和斑驳的颗粒。
从个别的像素(pixel)中产生连续图像的道理,和我们所熟悉的物质世界的现象非常
类似,只不过其过程更为精细而已。
物质是由原子组成的,但是假如你从亚原子(subatomic)的层次来观察经过处理的光
滑的金属表面,那么你会看到许多坑洞。
我们眼中的金属所以光滑而坚实,只不过是因为其组成部分非常微小。
数字化产物也是如此。
但是,我们在日常生活中所体验的世界其实是非常“模拟化”(analog)的。
从宏观的角度看,这个世界一点也不数字化,反而具有连续性的特点,不会骤然开关、
由黑而白、或是不经过渡就从一种状态直接跳入另一种状态。
从微观的角度看也许不是这么回事,因为和我们相互作用的物体(电线中流动的电子或
我们眼中的光子)都是相互分离的单位。
但是,由于它们的数量太过庞大,因此,感觉上似乎连续不断。
这本书就差不多包含了1000000000000000000000000个原子(书籍是一种极其模拟化的
媒体)。
数字化的好处很多。
最明显的就是数据压缩(datacomparession)和纠正错误(errorcorrection)的功
能,如果是在非常昂贵或杂音充斥的信道(channel)上传递信息,这两个功能就显得更加
重要了。
例如,有了这样的功能,电视广播业就可以省下一大笔钱,而观众也可以收到高品质的
画面和声音。
但是,我们逐渐发现,数字化所造成的影响远比这些重要得多。
当我们使用比特来描述声音和影像时,就和节约能源的道理一样,用到的比特数目当然
是越少越好。
但是,每秒或每平方英寸所用到的比特数,会直接影响到音乐或影像的逼真程度
(fide1ity)。
通常,我们都希望在某些应用上,采用高分辨率(reso1ution)的数字技术,而在其他
的应用上,只要低分辨率的声音和画面就够了。
举例来说,我们希望用分辨率很高的数字技术印出彩色图像,但是电脑辅助的版面设计
(computer一aidedpagelayout)却不需要太高的分辨率。
由此可见,比特的经济体系有一部分要受存储和传输比特的媒介所限。
在特定信道(例如铜线、无线电频谱或光纤)上每秒钟传输的比特数,就是这个信道的
带宽(band-width)。
可以据此衡量每一管线能够容纳的比特数量。
这个数量或叫做容量,它必须仔细地与呈现某一特定数据(声音、音乐、影像)所需要
的比特数量相匹配:对于传输高品质的声音而言,每秒64000比特已经算是相当大的数量
了;每秒传输120万比特对高保真音乐(highfidelitymusic)绰绰有余;但你如果想要传
送影像,则带宽就必须达到每秒传输4500万比特,这样才能产生绝佳的效果。
然而,过去15年来,我们已通过分别或同时从时间和空间的角度检视比特,并去除其
固有的累赘重复的部分,掌握了压缩原始声音和画面的数字技术。
事实上,所有的媒介都得以迅速数字化,原因之一就是我们在比大多数人所预测的时间
更早的时候就发展出了高水平的压缩技术。
直到1993年,还有些欧洲人辩称,数字影像的梦想要到下一个世纪才能实现。
5年前,大多数人都不相信,我们可以把每秒4500万比特的,数字影像信息,压缩到
每秒120万比特。
但是,到了1995年,我们已经可以把如此庞大的数字影像信息依照这个比例压缩
(compress)和解压(decompress),编码(encode)和解码(decode),而且成本低廉,
品质又好。
这就好像我们突然掌握了制造意大利卡普契诺咖啡粉的诀窍,这个东西是如此美妙,只
要加上热水冲泡,就可以享受到和意大利咖啡馆里的现煮咖啡同样香醇的味道。
媒体世界改头换面数字化可以让你在传送信号(signal)时,附加上纠正错误(电话杂
音、无线电干扰或电视雪花)的信息。
只要在数字信号中加上几个额外的比特,并且采用日益成熟的、能因噪音和媒体的不同
而相应发挥作用的纠错技术,就能去除这些干扰。
在CD光盘上,1/3的比待是用来纠正错误的。
同样的技术也可以应用到目前的电视机上,从而使每个家庭都可以接收到有演播室效果
的画面,影像比现在清楚许多,以致于你可能把这种电视误以为所谓的“高清晰度电视”
(high一definitionTV)。
纠正错误和压缩数据是发展数字电视(digiialteievision)最明显的两个理由。
以同样的带宽,过去只能容纳一种充满杂音的模拟电视信号,现在却可以塞入四种高品
质的数字电视信号。
不仅传出去的画面品质更佳,而且利用同一频道,你还可能拥有四倍的观众数目和四倍
的广告收入。
大多数的媒体管理人员在思考和论及数字化的意义时,念念不忘的正是现有的东西能以
更好和更有效率的方式传播。
但如同特洛伊木马(Trojanhorse)一样,这个礼物产生的后果可能令人意想不到。
由于数字化的缘故,全新的节目内容会大量出现,新的竞争者和新的经济模式也会浮出
海面,并且有可能催生出提供信息和娱乐的家庭工业。
当所有的媒体都数字化以后,由于比特毕竟还是比特,我们会观察到两个基本的然而却
是立即可见的结果。
第一,比特会毫不费力地相互混合,可以同时或分别地被重复使用。
声音、图像和数据的混合被称作“多媒体”(mu1timedia),这个名词听起来很复杂,
但实际上,不过是指混合的比特(commingledbits)罢了。
第二,一种新形态的比特诞生了棗这种比特会告诉你关于其他比特的事情。
它通常是一种“信息标题”(header)能说明后面的信息的内容和特征),那些经常要
为每篇报道拟定“摘要标题”以表明新闻内容的报社记者最熟悉这个东西了。
学术论文的作者也很熟悉这类标题,因为学术期刊也常常要求他们为自己的论文总结要
点。
在你的CD上,也可以找到简单的标题,让你能直接从一首歌跳到另一首歌,有时候,
还可以从中获取关于音乐的更多的材料。
这些比特看不见,听不到,但却能够告诉你、你的电脑或上台特别的娱乐设备一些与信
号相关的事情。
这两个现象,混合的比特和关于比特的比特(bits一about一bits),使媒体世界完
全改观。
相较之下,像视频点播(video一on一command)和利用有线电视频道传送电子游戏之
类的应用,就显得小巫见大巫了—它们不过是一座庞大冰山的小小一角。
想想看,如果电视节目改头换面成为数据,其中还包含了电脑也可以读懂的关于节目的
自我描述,这将意味着什么呢?你可以不受时间和频道的限制,录下你想要的内容。
更进一步,如果这种数字化的描述能够让你在接收端任意选择节目的形式—无论是声
音、影像还是文字棗那又会如何呢?如果我们能够这么轻易地移动比特,那么大媒介公司对
你我来说,还有什么优势可言呢?这些都是数字化可能引发的情况。
它开创了无穷的可能性,前所未有的节目将从全新的资源组合中脱颖而出。
智慧在哪里?电视广播有一个典型的特点:所有的智慧都集中在信息传输的起始点。
它代表着一种类型的媒介。
信息传播者决定一切,接收者只能接到什么算什么。
事实上,就每一立方英寸的功用来看,目前电视机可能是你家中最笨的电器(我还没把
电视节目包括在内)。
你的微波炉都可能比电视拥有更多的微处理器。
与其想象未来的电视会有更高的分辨率,更鲜艳的色彩,或能接收更多的节目,还不如
把它看成智慧分布上的一场变迁—或者,说得更准确一些,就是把部分智慧从传播者那端,
转移到接收者这端。
就报纸而言,传输者也同样掌握了所有的智慧。
但是大报却或多或少地避免了信息单一化的问题,因为不同的人在不同的时间,可以用
不同的方式来读报。
我们一页页地例览、翻阅报纸,由不同的标题和照片引导,尽管报社把相同的比特传送
给成千上万的读者,但每个人的阅读体验却大相径庭。
要探讨数字化的大未来,其中一个办法,就是看媒体的本质能不能相互转换。
看电视的体验能不能更接近读报的体验?许多人党得报纸新闻要比电视报道更有深度。
这是必然的吗?同样地,人们认为看电视比读报能够获得更为丰富的感宫体验。
一定如此吗?答案要看我们能不能开发出能力我们过滤、分拣、排列和管理多媒体的电
脑,这种电脑将为人们读报,看电视,而且还能应人们的要求,担任编辑的工作。
这种智慧可以存在于传输者和接收者两端。
当智慧藏身于传输者这端时,你就好像自己聘请了一位专门撰稿人—就好比《纽约时
报》根据你的兴趣,为你度身订制报纸。
在这种情况下,信息传输者会特别为你筛选出一组比特,经过过滤、处理之后传送给
你,你可能会在家中将其打印出来,也可能选择以更加互动的方式在电子屏幕上观看。
另一种情况则是在接收者一端设置新闻编辑系统,《纽约时报》先发送出大量的比特,
可能包括5000篇不同的文章,你的电子装置再根据你的兴趣、习惯或当天的计划,从中撷
取你想要的部分。
在这个例子中,智慧存在于接收者这端,而传输者一视同仁,把所有的比特传送给所有
的人。
未来将不会是二者只择其一,而是二者并存。
2.人类新空间/无限带宽从涓涓细流到浩浩江河
60年代未,当我还是个电脑制图助理教授时,没有人知道电脑制图是什么东西,电脑
完全置身于日常生活之外。
今天,我经常听到65岁的商界巨头们吹嘘他们伟大的电脑设备里有多少字节的内存
(memory),或是他们的硬盘(harddisk)容量有多大。有的人则一知半解地讨论他们的电
脑速度有多快——这要归功于“内置英特尔处理器”(1nterlnside)的出色广告,或兴致
勃勃地谈论操作系统(operatingsystem)的特色。我最近碰到一位社交名媛,她是个富有
而迷人的女士,由于精通微软(Microsoft)的操作系统,她甚至创办了一家小公司,专门
为在电脑上还不怎么上道的同伴提供咨询服务。她的名片上印着:“我提供‘视窗’
(windows)服务。”
带宽就不同了。一般人不怎么了解带宽,尤其在今天,光纤已经带着我们从较窄的带宽
文步跳跃到近乎无限的带宽。带宽指某个特定信道传送信息的容量,大多数人都把它想象为
管子的直径或高速路的车道。
这些比喻忽略了不同的传输媒介(铜线、光纤、大气)之间一些微妙和重要的差别——
我们有能力根据我们设计(及调制)信号的方式,来决定在同样的铜线。光纤或大气中每秒
传输多少比特。尽管如此,我们还是可以概略介绍一下电话铜线
(copperte1ephonewire)、光纤(flber)和无线电频谱(radiospe-ctrum)的特点,让大
家能够更好地了解没有重量的比特究竟是如何运动的。龟兔赛跑
电话铜线通常被称为“双绞线”(twistedpair),因为早期它们像辫子一样纠结在一
起,恰如今天还能在一些古老而豪华的欧洲饭店中看到的电灯线一样。它通常的速率是
9600比特/秒(bps),或称9600波特(baud)。(bps和baud在技术上的含义并不完全
相同,但现在已可以互换使用,我在本书里也是这么用的。baud这个名称是为了纪念电信
技术先驱Emi1eBaudot,就像电报中的“莫尔斯电码”以发明人莫尔斯命名一样。)
新型的调制解调器能以38400波特的速率工作(这仍然比连接大多数美国家庭的铜线的
潜在传输速率慢了100倍以上)。我们可以把双绞线想成“龟兔赛跑”故事中的那只乌龟,
它虽然跑得很慢,但并不像你原本想象的那么慢。
你可以把光纤的容量想成无限大。我们并不清楚光纤每秒钟究竟可以传输多少比特。最
近的研究表明,利用光纤,我们每秒几乎可以传送:万亿比特。也就是说,像一根头发丝那
样细的光纤在不到1秒钟的时间里,可以传送《华尔街日报》创办以来每期报纸的所有内
容。以这样的速度来传递数据,光纤可以同时传送100万个频道的电视节目——大约比双绞
线快上20万倍,真是一大跃进!而且,别忘了,我说的还只是一条光纤而已。所以如果你
还嫌不够的话,你可以制造更多的光纤。毕竟,光纤只不过是玻璃罢了。
一般人都觉得以太(ether,即大气,也就是一般人说的“无线电波”)的传输能力也
是没有止境的。它毕竟就是空气,而空气埃米勒.波多(1845一1903),法国发明家,发明
电传打字机电码“波特码”(Baudotcode)。塞缨尔.莫尔斯(SamueIMorse,1791一
1872)美国发明家,发明莫尔斯电码(Morsecode)。到处都有。我虽然通篇使用以太这个
词,但它其实只有历史上的意义。无线电波(radiowaves)一经发现,以太就被当作传播这
些电波的神秘媒介,然而科学家们无法找到它,倒是借此发现了光子(ph-oton)的存在。
同步卫星(stationarysatellite)在赤道上空22300英里的轨道上运行,这意味着地球到
同步轨道之间充斥着34万亿立方英里的以太,这么多的以太一定能够传送许多比特,同时
又能让这些比特不至于彼此碰撞。当你想到全球数以百万计的遥控器
(remotecontrolunit),正是利用和电视机及其他类似设备进行无线通信
(wirelesscommunication)的方式来操作时,这种说法确实有它的道理。由于这些遥控器
威力不大,从你的手中传送到电视机上的区区几个比特,并不会改变邻近公寓或城镇的电视
频道。但是,正如大家听到过的那样,假如换作无绳电话(cordlesstelephone),清形就
大不一样了。地空大转移
一旦我们利用以太作为强大的电信和广播传输媒介,我们就必须格外小心,不要让信号
彼此干扰。我们必须乐于把自己事先定位在频谱中的某个部分,而不能贪得无厌地使用以
太。必须尽可能高效地运用它,因为不像光纤,我们无法不断制造更多的以太。大自然早已
一次性地结束了这项工作。
想要高效使用以太,办法很多。例如,可以通过建立网格、划分传输单元的办法,使用
户在不同的信号区(quadrant)内使用相同的频率,这样频谱的各个部分可以得到重复利
用;也可以进入以前被视为禁区的部分(因为那些频率会毁了那些天真的家伙)。但是即使
你掌握了所有的窍门,最大限度地占有了频请,和光纤能提供的带宽以及我们能不断制造和
铺设光纤的能力比起来,以太能提供的带宽就显得极为有限了。因此我的建议是,今天的有
线和无线通信应该交换位置。
内布拉斯加州(Nebraska)参议员鲍勃.凯瑞(h6kerrey)竞选总统时,曾经花了几小
时参观我们的媒体实验室。我们见面的时候,他劈头就说“尼葛洛庞帝式转换”
(TheNegroponteSwitch)。这个概念是我在北方电信公司(NorthernTelecom)的一次会议
上首次加以探讨和介绍的,那次会议上我和乔治.吉尔德(GeorgeGilder)是演讲入,它的
含义简单说来就是,目前经由地下(即电缆)传输的信息,将来会经由以太传输,反之亦
然。换句话说:空中传输的信息会走入地下,而在地下传输的信息则会升上天空。我把这叫
做“交换位置”,吉尔德则称之为“尼葛洛庞帝式转换”。这个名词不脏而走。
我认为这种位置转换的好处是不言而喻的,因为地下管线的带宽是无限的,而以大的带
宽则是有限的。以太是唯一的,但光纤的数目却无穷无尽。尽管我们可能会越来越聪明地使
用以太,我们终究还是得扭所有元线通信的频谱节省下来,用在像飞机。轮船、汽车、手提
箱或手表等移动的物体上。它们的活动范围无法限制。光纤:自然之道
6年前,当柏林墙倒塌时,德国联邦邮电部哀叹时间早了5到7年,因为当时光纤的价
格还太贵,在东德全面铺设光纤电话系统为时尚早。
今天,即使加上两端的电子成本,光纤都比铜线便宜。如果你遇到的情形不是这样,只
要再耐心地等上几个月,一切就会改观,因为光纤连接设备、开关和变换器的价格都在直线
下降。除非通信线路只有几英尺或几码长,或是安装人员的技术不够熟练,否则今天实在没
有理由在电信中再使用铜线了(假如把铜线的维修费用考虑在内,那就更不划算了)。
铜线唯一真正的优点是能够传送电力。对电话公司来说,这是个敏感话题。电话公司一
向引以为荣的是,当飓风袭来的时候,也许会造成停电,但电话系统却仍可以运转如常。如
果你的电话线采用的是光纤而不是铜线,就必须从当地电力公司取得电力,这样如果出现停
电的话,电话也一定会受到牵连。即使有备用电池,由于要花特别的功夫来维护,也不算是
什么明智之举。基于这个原因,将会出现包铜的光纤或包光纤的铜线。但是,从比特的角度
看,把整个地球连成一体的,终究还会是光纤。
我们还可以从另外一个角度,观察从铜线到光纤的转变。美国的电话公司每年大约会有
5%的设备被更新,出于维修和其他的原因,他们把铜线换成光纤。尽管这种升级工作在各
地的发展并不平衡,但是,饶有趣味的是,如果照这个速度进行下去,再过20年左右,整
个国家都会遍布光纤。关键是,无论我们是否需要这样的带宽,是否懂得怎样运用它,我们
很快就会发展出全国性的宽带信息结构。至少,光纤系统会为我们提供品质更高、也更可靠
的通信服务。
我们花了十几年时间,才把哈罗德.格林法官(JudgeHaroldGreene)在1983年犯下的
错误改正过来。当时,他禁止地区性的贝尔公司(RegionaIBeIIOperaiingCompanies)进入
信息和娱乐业。一直到1994年10月20日,美国联邦通信委员会(FCC,
FederaICommunicationsCommission)才迈出重要的一步,批准了所谓的“视频拨号”
(videodialtone)。
具有讽刺意味的是,为贝尔公司游说的人,提出了一种似是而非但却十分有效的理由,
以证明进入信息和娱乐业的正当性。他们获得了成功。
电话公司称旧有的电话服务已经跟不上形势的需要,除非批准它们成为更广义的信息提
供者,否则它们没有积极性去承担建设新的基础设施(也就是光纤)的巨额费用。
且慢。电话公司一向都扮演信息提供者的角色;事实上,大多数贝尔公司主要的财源都
是电话黄页(Yel1owPages)。但是让人莫名其妙的是,假如电话公司以原子方式,把这类
信息送到“视频拨号”意指获取影像就如电话拨号一样容易,即允许发送和接收影像成为电
话公司传输服务的一部分。电话号码簿的一部分,专载公司、厂商等电话用户的名称及号
码,按行业划分排列,并附有分类广告。你的家门口,就没有问题;但假如它们把信息化为
比特,以电子方式传送给你,就犯法了。显然这是格林法官的看法。
因此,游说人士辩称,电话公司只有进入电子信息传输业,其掏钱铺设地区性光缆线路
的行为才可能具有合理性。他们的论点是,假如没有新的收入来源,就没有足够的动力来进
行大规模投资。这个论点获得了认可,电话公司正大举进入信息和娱乐业,并且铺设光缆的
速度也比过去稍微快了一些。
我觉得这个结果是相当不错的。它会使消费者得益,但上面的这番说理却站不住脚。电
话公司以貌似有理的论调推翻了貌似有理的法律,但现在却可能迷信上了自己的论调。我们
并不需要这么大的带宽来提供信息和娱乐服务。事实上,120一600万比特/秒的带宽更适
合目前大多数媒体的需求。我们甚至还没有开始了解或发挥这一带宽的创造性潜能。律师和
电话公司的高级管理人员花了10年时间对格林法官施加压力,然而与此同时,他们却忘记
了先去看一看现有的庞大设施:双绞线。
很少有人认识到铜线的性能有多好。一种叫做“非对称数字用户环线”的技术能够用比
较短的铜线传输大量的数据。ADSL-1能够为75%的美国家庭和80%的加拿大家庭每秒输入
154.4万比特的信息,同时每秒输出64000比特的信息。ADSL-2的操作速度超过300万比
特/秒,ADSL-3更超过600万比特/秒。而ADSL-1对VHS画质的影像而言,已经足够好
了。
虽然从长远来看,这并不是把多媒体信息传输到家庭的好办法,但令人不解的是,大多
数人竟会在现阶段把它忘得于干净净。一种说法是,每个订户要负担的费用太高,但费用高
是因为用量小的缘故。而且,即使暂时费用偏高,就算每个订户要花掉1000美元好了,它
也是逐渐追加的,大部分费用会随着订户的增加而分摊到各家。更何况,如果服务能够引起
他们的兴趣,许多美国人愿意在3一4年的时间内,部分或全部地支付这1000美元,以分
摊启动成本。因此,尽管光纤是大势所趋,利用现有的铜线,我们还是可以有所作为、有所
获益的。
很多人都忽视了铜线这块踏脚石。他们以为必须全面而迅速地转换到光纤上,利用其无
限的带宽,才能维持强大的竞争优势。然而,他们没有认识到,吹自然和商业利益会比法规
上的种种诱因,更能促进光纤的自然发展。就像春情发动的狗具有异常灵敏的嗅觉,提倡宽
带的学者,能够嗅出建立宽带网络的每一个政治机会,仿佛这是全国的当务之急或必须力争
的人权一样。事实上,毫无限制的带宽可能会是自相矛盾的,并造成一定的负面影响:人们
被过多的比特所淹没,外围的机器设备变得毫无必要地蠢笨。拥有无限带宽并不是坏事,也
不见得有错,但就像性开放一样,也不一定就是好事。我们真的想要或需要这么多比特吗?
少就是多
“少就是多”这一说法来源于建筑家米斯.范.德.罗赫(MiesvanderRohe)。我在思考
需要传输的信息量和接收信息的方式时,从这句话中得到了许多启示。对于任何新媒介的初
学者而言,这句话都切中了要害。初学者并不明白“少就是多”。
就以家用摄像机(homevideocamera)为例。当你第一次得到并操作摄像机时,你很可
能会不停地转换拍摄角度,不时地拉近或推远,同时试验各种你刚发现的新花招。结果是录
制了一盘你羞于示人的蹩脚的录像带,连你的家人都退避三舍,因为层出不穷的镜头变换令
他们简直烦透了。经过一段时间以后,你冷静下来,才会更姻熟而自制地运用新技术带给你
的自由。
大多的自由对于我们从激光打印机(laserprinter)上拿到的打印稿也有不良影响。能
改变字体和字号的诱惑污染了现在许多大学和企业的文件,许多人浑然不觉地混用不同形态
和大小的字母,一会用正常字体,一会用黑体,一会又用斜体,一会再给它们加上阴影。只
有在对印刷版式(iypography)有了更深一层的了解后,才会明白,坚持用单一字体
(typeface)反而更恰当,变换字号大小也只能偶一为之。“少”其实可能反而意味着
“多”。
带宽的情形也是一样。许多人大力主张:既然我们拥有宽带,就应该采用宽带。这种主
张缺乏头脑。一些关于带宽的自然法则显示:对某人发射更多的比特,并不比开大收音机音
量以获取更多信息的做法更有道理或更合乎逻辑。
举例来说,在1995年,对于所谓“VHS画质的影像”来说,120万比特/秒是一个门
槛。假如你想要得到更佳的画面,尽管把传输速率提高2到3倍好了,但是超过600万比特
/秒的容量就没有什么大的用处。我们并不会因为有了这么多的带宽,而享受到富于想象力
的新服务。
光纤进入家庭并不意味着新的信息和娱乐服务会随之而来。这一服务要想发展,想象力
才是关键。把100000比特区缩为1带宽与数字计算之间的关系十分微妙。今天,在可视电
话(videotelephone)和更昂贵的电视会议系统(videoconferencingsystem)上,带宽与
计算之间的交换条件十分明显。如果在线路的两端都进行数字计算,你就可以减少来回传输
的比特。在线路的两端投入一些资金进行数字影像处理,你所占用的信道容量就会较小,传
输费用也会因之降低。一般而言,可以把数字影像视为不问信息内容而对数据进行压缩的一
个例子。无论节目是橄榄球比赛、热门的新闻访谈,还是詹姆斯.邦德的追逐战,人们都采
用同样的编码技术。即便对计算机科学是外行,你也可能会猜到所有这些节目的压缩办法是
可以有所不同的。一旦考虑到信息内容,我们可以用截然不问的方式压缩数据。只要看看下
面这个人际沟通的例子就会明白了。假设有6个人围坐一桌共进晚餐,他们正热烈谈论一个
不在场的人——甲先生。在讨论中,我向坐在对面的妻子伊莲眨了眨眼。晚饭后,你走过来
问我:“尼古拉,我看到你向伊莲递眼色,你想告诉她什么?”我对你解释说,前天晚上,
我们恰好和甲先生一起吃晚饭。当时他说,和如何如何相反的是,他实际上如何如何,即使
大家都以为如何如何,最后他的真正决定却是如何如何,等等。换句话说,我大约要花10
万比1的比特度,才能跟你讲明白我用1个比特就能和我太太沟通的话(请容许我暂且假
设,眨一下眼睛,正好等于在以太中传送了1个比特)。这个例子告诉我们的是,传输者
(我)和接收者(我太太)有共同的知识基础,因此我们可以采用简略的方式沟通。在这个
例子中,我通过以太向她发射了一定的比特,触发了她脑子里的更多信息。当你问我,我和
她交流了什么时,我不得不把所有的10万比特全部传送给你。我因此失去了10万比1的数
据压缩度。有个故事说,有对夫妇把数百个笑话记得滚瓜烂熟,因此只需提到笑话的编号,
彼此就能心领神会。寥寥几个数码就会唤醒他们对整个故事的记忆,使他们大笑不止。把这
个方法更平实地用在电脑数据压缩上,就是把常用的较长的词编上号,然后传递·这
几个比特而不是全部的字符串。当我们以共享的知识来换取更多的带宽时,这类技术会越来
越普遍。浓缩信息不仅节省了信息传送的成本,同时也节省了我们的时间。同样的比特,不
同的身价采用今天的电话计费方式,如果我要把关于甲先生的事情告诉你而不是我太太,我
可能得付出10万倍的电话费。对电信公司而言,如果来回传送少量比特,根本就无利可
图。目前,通话的经济模式是,根据每秒传送多少比特或传送每个比特需要多长时间来计
费,比特究竟代表什么,完全无关紧要。而要了解带宽的经济学,真正的问题在于,是否有
些比特比其他比特价值更高?答案显然是肯定的。但是,更复杂的问题是,一个比特的价值
是否不仅应该随其本质而变化(例如,它是电影比特、对话比特,还是心脏起搏器比
特?),而且、也应参照使用者的身分、使用时间或方式而变化?包括美国《国家地理杂
志》(NatzoriaIGeographic)的工作人员在内,大多数人都同意,一个使用该杂志图片档
案来完成作业的6岁儿童,应该免费或基本免费地得到这些图片比特。相反,如果我使用这
些比特来写论文或拟订商业计划,就应该支付一定的费用,甚至作出额外贡献,以贴补这位
六龄重。于是,比特不仅具有不同的价值,而且这种价值还会因使用者和使用方式而发生变
化。突然之间,社会福利比特、少数民族比特和残疾人比特都纷纷出现了!国会必须很有创
意地拟定出一个公正的制度框架才行呢。为比特设定不同的价格,并非始于今日。我在道.
琼斯公司(DowJones)开了个户头,借此和股票市场搭上了线。我只能从户头上得到15分
钟后的股票市场行情。如果我想和我那86岁、从事股票经纪的叔父一样,随时拿到最新的
报价,我还得另付一笔可观的费用给道.琼斯公司或我叔父。这就好像平信和航空信的价格
差异一样,搭飞机和乘火车来的比特,身价自然不同。在实时(real一time)通信的情况
下,所需要的带宽要视对话的媒介而定。如果我是在跟你通话,那么,想要以比我说话还快
的速度把声音传给你,简直毫无意义。当然,比说话的速度慢上许多,或延迟一小段时间才
传给你,也令人无法接受。通过卫星线路打电话时,即使是1/4秒的迟滞,都令大多数人
不安。但假如我把讯息录下来,希望将其传给你,并且是按分钟付电话费的,那么我当然希
望每秒传输的比特越多越好。全国各地利用调制解调器来获取和传送信息的人,都会有同
感。几年前我们还觉得2400波特的速率已经相当不错了,而今天,却随处可见38400比特
/秒的调制解调器,并因之减少了94%的电话费用。对电话公司而言,幸运的是,50%的
跨太平洋电话通信和30%的跨大西洋电话通信是以9600比特/秒、而不是64000比特/秒
的速率传送的传真资料。虽然64000比特/秒的调制解调器也已经面市。星状和环状网络
重要的不仅是信道的带宽,还有它们的设置(configuration)。简单他说,电话系统
是“星状”网络("star"network),电话线从一个固定点放射出去,就像华盛
顿或巴黎的街道一样。从你家到当地最近的电话交换站之间相隔一段距离,如果你愿意的
话、可以从家里沿着电话线,一直跑到那里去看一看。
相反地,有线电视从诞生之日起就呈“环状”(“1oop”),好像圣诞树上的彩灯串一
样,串联起一户户的人家。电话双绞线的窄带和同轴电缆(coaxia1cab1e)的宽带自然而然
地造就了不同的星状和环状网络。在第一个例子里,每个家庭都接入一条专用的窄带电话线
(dedicaied1ow-bandwidthline)。在第二个例子里,许多户人家共享一种宽带服务。
星状和环状网络的体系结构(architecture)也会受信息内容的性质的影响。在电话网
络中,每次的对话内容都不一样,传给一户人家的比特和其他人毫不相于;本质上,这是个
多点对多点(vast-point-tovast-poini)的作业系统。电视则不同,你和邻居收看的是相
同的节目内容,因此采用圣诞树彩灯串的通信方式——一点对多点(poini一
tomultipoint)的方式,再合理不过了。有线电视经营者传统上一直都照搬我们都熟悉的无
线电视传播的做法,只不过把电视信号传输从空中转入地下罢了。
但是,传统智慧毕竟非常传统。未来,电视节目的传送方式将发生剧烈的变革,你将不
再满足于和邻居收看同样的电视节目,或是只能在特定的时间内,看你想看的节目。因此,
有线电视公司的想法将越来越接近电话公司,需要有很多的交换机和“基地”。事实上,25
年后,不仅电话公司和有线电视公司不再有任何差别,电话和有线电视的网络体系结构也将
趋于一致。
结果,大多数的网络都将是星状网络,只有地区性的或无线广播网络才会采用环状,以
便能在同一时间把信息传给所有家庭。通用汽车的休斯电子公司(GMHughesE1ecironics)
喜欢把它的卫星电视直播系统(DirectTVsystem)称为“弯曲的管线”,而且还会告诉你,
直播卫星电视系统就等于可以传送信息到每个家庭的有线电视系统。的确,假如你人在美
国,正读到这一页时,除非撑起一把铅伞,否则休斯公司的卫星会在:秒钟内把10亿比特
一股脑泼到你的身上,躲也没处躲。水管和滑雪缆车
许多刚刚跨入数字世界的人往往把带宽理解成管子工的活计。假如你把比特想象为原
子,脑海中就会浮现大大小小的管子、水龙头和给水栓的形象。最常见的一个比喻是,使用
光纤就好像使用水管饮水一样。这个比喻很有建设性,但是也很容易引起误解。水不是流动
就是不流动,你可以依靠拧紧水嘴来控制花园中水管的水流量。但是,即使水管中的水流减
慢到只剩下涓涓细流,水原子仍然是作为一个群体在移动。
比特就不同了。或许用运载滑雪游客的缆车来比喻更恰当。缆车以稳定的速度移动,途
中或多或少的乘客上上下下。同样地,你用一组比特构成一个信息包(packei),然后把这
个信息包放进能以每秒百万比特的速率传输信息的管道中。现在,假如我把一包速率为10
比特/秒的信息丢进一个快速流动的管道中,则我的有效带宽是每秒10比特,而不是这个
管道的速度。
听起来好像很浪费,但事实上这是个聪明的想法。因为其他人也把信息包丢进同样的管
线中棗这种管线构成了互联网络和异步传输模式系统的基础(在不久的将来,所有的电话网
络都会以ATM模式工作)八你将不会再像现在传送声音一样,把整条电话线占满,而是把一
个个标好了名字和地址的信息包送入管线中循序前进,它们知道什么时候在什么地方走下缆
车。你为每个信息包付费,而不是按分钟付费。
这种分封带宽的方式,还可以从另外一个角度来理解:达到10亿比特/秒的速率的最
好办法,就是在百万分之一秒中,传送1000比特;在于分之一秒中,传送100万比特,以
此类推。拿电视来说,可以把这一过程想象为在几秒钟内接收整整一个小时的影像,而不是
那种用水龙头控制水流的情况。
与其把1000个电视节目传送给每个人,还不如在:灿的实时瞬间,把某个节目传送给
某个人。这将彻底改变我们对广播电视媒体的看法。传播比特的速度和人类消费比特的速
度,将变得毫不相干。
3、比特电视横空出世/媒介再革命高清晰度电视是个笑话
看电视的时候,你会抱怨影像的分辨率、屏幕的形状或是活动画面的质量吗?大概不会
吧。如果你有什么抱怨,一定是对节目不满意。或是抱怨像布鲁斯.斯普林斯汀所说的:
“空有57个频道,却毫无内容”。然而,几乎所有关于电视升级换代的研究,都把目标瞄
准影像显示的精致化,而不是节目的艺术性。
1972年,有几位富于前瞻性的日本人自问,电视的下一步应该朝哪一个方向走。他们
的结论是:更高的分辨率。他们假定,电视由黑白转为彩色之后,紧接着的是拥有如电影般
精致的画质,或叫“高清晰度电视”。在模拟世界里,让电视朝这个方向升级,是很合乎逻
辑的想法。因此,在接下来的14年中,日本人孜孜不倦地研究他们眼中的“高品质电视”
(Hi一Vision)。
1986年,欧洲警觉到日本人可能会独霸新一代的电视市场。更糟的是,美国人也接受
了“高品质电视”的想法,和日本人一起极力鼓吹,想要把它变成世界性的标准。今天,美
国许多高清晰度电视的支持者和新民族主义者都轻易地把当初的错误判断——支持日本式的
模拟系统——抛在脑后。欧洲纯粹从贸易保护的角度出发,否决了日式系统,尽管是出于错
误的理由,却给我们所有人帮了大忙。欧洲人紧接着开始发展他们自己的模拟高清晰度电视
系统——叫做HD一MAC——在我看来它比日本的“高品质电视”略胜一筹。
就目前的水准而言,所谓的高清晰度电视是个笑话。数字电视才代表未来
1990年,呈现在我们面前的一种可能情况是,日本、欧洲和美国,会各自沿着完全不
同的方向发展新一代电视。当时,日本已投入了18年的金钱和精力发展高清晰度电视。在
这段时间内,欧洲人眼见自己错失了计算机工业的发展契机,下走决心不能再在电视上重蹈
覆辙。而在几乎没有任何电视工业的美国,高清晰度电视被视作重振消费电子业的大好机
会。(西屋电气、RCA和Ampex等短视的美国公司早就把电视机市场拱手让人了。)
当美国准备迎接改进电视技术所带来的挑战时,数据压缩技术才刚刚萌芽,还不足以形
成明显的行动步骤。而且,身为主角的电视设备制造商也不适应这个战场。和苹果及太阳微
系统(SunMicrosystems)这样的年轻数字科技公司不同的是,电视技术公司是模拟思想的
陈旧温床,对它们来说,电视只与画面有关,与比特毫无关系。
但在美国觉醒之后不久,1991年,几乎一夜之间,每个人都追随通用仪器公司
(GeneralinstrumentCorporation),成为数字电视的鼓吹者。不到6个月,美国所有关于
高清晰度电视的提议都改弦易辙,从使用模拟技术转为使用数字技术。有充分的证据显示,
数字信号的处理更合乎成本效益,而欧洲则直到1993年2月才承认这一点。
1991年9月,我在法国总统弗朗索瓦.密特朗(FrancoisMitterrand)举行的午餐会
上,向他的许多官员发表了一次演讲。或许因为法语不是我的母语,我没能说服他们相信,
我不是在试图让他们放弃自己所称的“领先地位”,而是要他们摆脱我所谓的“缠绕在脖子
上的锚”。
我在1992年和日本首相宫泽喜一见面的时候向他指出,“高品质电视”没有前途,他
对这一说法感到震惊。倒是撒切尔夫人(MargaretThatcher)听进了我的建言。最后,英国
首相约翰.梅杰(JohnMajor)的一次大胆行动使局面得以扭转:1992年末,他否决了关于
给高清晰度电视节目补贴6亿欧洲货币单位(合8亿美元)的提案。欧洲联盟(那时还叫欧
洲共同体)终于在1993年初决定,放弃模拟的高清晰度电视计划,迎接数字化的未来。
其实,日本人非常清楚数字电视才代表着未来。1994年2月,当倒霉的日本邮政省放
送行政局局长江山晃正提议日本跨入数字世界时,日本的产业领袖第二天便群起而攻之,逼
着他硬生生地把话吞了回去。日本在高清晰度电视上投的钱实在大多了、他们绝不会公开表
示要另起炉灶。
我清楚地记得在一次电视座谈会上,日本消费电子产业的巨子们一个个信誓旦旦地表
示,他们全力支持模拟的“高品质电视”,并且暗示江山晃正简直是疯了。我得咬住我的数
字化舌头。恐怕他们为了是保住颜面。一个个变成了双面人。技术对,问题却槁错了
好消息是,针对电视的未来,美国采取了正确的技术——数字技术。坏消息是,我们仍
然在漫不经心地讨论错误的问题,即那些关于画面质量的问题,例如分辨率啦,帧频
(framerate)啦,以及屏幕高宽比(aspectratio)啦,等等。更糟的是,我们还试图一举
决走所有这些具体标准,并且通过立法把变数化为常数。数字世界给我们的最好礼物就是,
你根本不必做这些事情。
即使模拟世界都不再冥顽不化。曾经到过欧洲旅游的人,都记得可怕的变压器问题,必
须把220伏的电压转换成110伏才能供美国电器使用,据说曾创造出IBM个人计算机的唐.
埃斯特里奇,有一天在IBM位于佛罗里达州波卡雷登(BocaRaion)的工厂的停车场里,下
令让个人计算机从此不必担心电压到底是110伏还是220伏。这个古怪的命令很快得到执
行。今天,几乎所有的个人计算机都可以和各种不同的电源相接。这个故事的涵义是,执行
埃斯特里奇的命令时,人们赋予了机器以智慧(把过去人们担心的问题换成由插头来担
心)。这对电视机制造商而言,是一大启示。
我们将看到越来越多的系统不仅有能力适应110伏或220伏,60赫兹和50赫兹,而且
还能配合不同数量的扫描线(scan1ine)、帧频和屏幕高宽比。这样的情况已经发生在调制
解调器身上,它们大量进行相互切磋以达成最好的通信协议,电子邮递(E一mail)也出现
了同样的状况,系统采用各种不同的通信协议,在不同的机器之间传递讯息,有时极为成
功,有时效果稍差——但几乎从来不会一片空白。
数字化是迈向成长的通行证。发初之初,你不必给每一个都加上点,给每一个都加上小
横线。你可以为未来的发展预先建立连线设施,制订出比特之间彼此沟通的协议,研究数字
电视的学者一直忽略了这项资产。他们不仅把时间花在错误的问题(高清晰度)上,而且把
其他所有的变数都通通考虑在内,并把它们看作像吹风机的110伏电压一样的问题。
关于交错扫描(interlace)的争论就是一个好例子。电视每秒可呈现30帧画面。每帧
画面都由两个所谓“扫描场”(field)组成,每个场则包含了半数的扫描线(奇数线或偶
数线)。因此,每帧画面所包含的是恰好偏移了一条扫描线的两个场,而且移位填补的动作
会在1/60秒中及时完成。当你看电视的时候,你在每秒钟内看到的是“交错”在一起的
60个场,因此画面上的动作显得十分平顺,但每个场其实只包含了一半的影像。结果,你
觉得画面的动感甚佳,并且只用一半的带宽,就能够呈现出清晰的静态物体。当电视广播处
在模拟阶段,而且带宽仍然奇货可居时,这是个伟大的构想。
但是,当我们谈到电脑显示(display)时,问题就来了。这时交错技术不仅毫无意
义,而且对移动的影像反商有害。电脑显i同。不提别的,单就电脑发展而言,交错扫描技
术毫无前途,电脑工程师避之唯恐不及,倒也是正当之举。
但是,交错技术的死亡会是一个自然的过程。通过法律来禁止使用它,会和殖民地时期
颁布的清教徒法规一样愚不可及。数字世界比模拟领域更有弹性,数字信号可以携带各种各
样关于自身的额外信息。计算机可以即时处理或事后处理各种信号,增加或减少交错,改变
帧频,并且修改屏幕高宽比,让某个特殊信号的长方形形式要素能够恰好适合某个特殊显示
屏幕。因此,我们最好不要任意制定任何一种固定的标准,因为今天听起来很合逻辑的做
法,明天可能就会变成荒谬之举。电视也升级
数字世界从本质上说可以不断升级。与过去的模拟系统相比,数字系统可以不断地、有
机地发展和改变。你去购买新电视机的时候,会把旧电视扔掉,好给新的腾地方。但是,如
果你有了一部电脑,你却很习惯给旧电脑增加各种新的性能以及硬件和软件,而不会为了一
点点升级改进,就换掉所有的部件。事实上,“升级”(upgrade)这个词本身就带有数字
化味道。我们越来越习惯于让计算机系统升级,获得更好的显示效果,内置更完美的声音,
并期待软件有更上乘的表现,而不是原地踏步。为什么电视不能如法炮制呢?
电视终会如此。今天我们被困在3种模拟电视标准中:美国和日本用的是NTSC,它是
NationalTelev-isionSystemsCommittee(全国电视系统委员会)的缩写,欧洲人会告诉
你,NTSC代表NeverTheSameColor(颜色永远变来变去);PAL(PhaseAlternatingLine,
逐行倒相制)标准独霸欧洲,而法国则采用SECAM(SEqueniiaICouleurAvecMemoire)标
准,意为“顺序与存储彩色电视系统”,美国人喜欢戏称为“和美国相反的东西”
(SomethingEssential1yContrarytoAmerica)。其他国家则犹豫不决,用选择第二通用语
的逻辑,从中选择一种电视标准。选择数字化,也就是要超然独立于种种标准的限制之外。
如果你的电视不会说某一特定的方言,你也许将不得不到本地的电脑商店中,购买一台数字
解码器,就好像你今天力电脑购买软件一样。
假如分辨率是个重要的变数,那么无疑地,解决办法是建立一个可升级的系统,而不是
只盯牢今天可以轻易在屏幕上显示的特定扫描线数目。当你听到人们谈论1125条或是1250
条扫描线时,这些数目一点也不神奇)只不过刚好很接近今天阴极射线管(CRT,
cathoderaytube)的最高显像极限。事实上,过去电视工程人员思考扫描线的方式,在今天
已经行不通了。
过去,随着电视机变得越来越大,观看者离得也越来越远,直到退入墙边的长沙发为
止。平均起来,进入观看者瞳孔的每毫米扫描线数目几乎是固定的。
接着,在1980年,事情发生了突然的变化,把人们从长沙发里带到了桌前,体验观看
18英寸屏幕的感受。这一变化使人们对扫描线的看法刚好倒了个个儿,因为我们无法再去
想每个画面的扫描线数目(像过去对待电视机一样),而是开始考虑每英寸的扫描线数目,
我们在看打印件或现代的电脑显示器时就是这样做的。施乐公司(XeroxCorporation)的帕
洛阿尔托研究中心(PARC,PaloAltoResearchCenter)首先开始从每英寸扫描线的角度来思
考扫描线的问题。显示器越大,需要的扫描线就越多。最后,当我们可以制造出平面显示器
(flat一paneldisplay)时,我们将有能力呈现分辨率达到万条扫描线的影像。把我们的
思路局限于今天1000条左右的扫描线上,是非常短视的。
要想在明天达到极高的分辨率,就必须在今天就让系统具有升级的能力,但是今天鼓吹
数字电视系统的人,却没有一个提倡这种观念。这真是奇怪。把电视当作收费亭
所有的计算机硬件和软件制造商都在向有线电视业大献殷勤。考虑到ESPN体育频道的
订户居然高达6000万,他们的这种举动也就不足为奇了。微软、硅谷图形公司
(SiliconGraphics)、英特尔、IBM、苹果,DEC和惠普(HP)都与有线电视业达成了重要
协议。导致这种沸腾景象的原因是电视置顶盒(set一topbox)。现在这个盒子不过是台调
谐器(tuner),但注定要担负更重要的任务。如果照过去的速度,我们很快就会有各式各
样的电视盒子,就好像我们现有的红外线遥控器一样多(一个用在有线电视上,一个用来接
收卫星信号,一个给双绞线用,还有一个是为了超高频信号传输,等等)。这样一种互不兼
容的置顶盒的大杂烩景象真是令人感到万分可怕。
商家对这个盒子的兴趣,来源于它的一种潜在功用。抛开别的不谈,这个盒子可能会变
成收费亭,它的供应商借此成为某种意义上的守门人,根据经由收费亭进入你家中的信息的
多少,而收取可观的费用。听起来,这像个只赚不赔的好生意,但却不见得合乎大众的最佳
利益。更糟的是,置顶盒的构想本身在技术上就很短视,而且抓错了重点。我们应该放宽视
野,转而把目光放在一般用途)而非专用的电脑设计上。
在“置顶盒”这个名称中,“盒子”这个词隐含了各种错误的涵义,但是它的理论如
下:我们对带宽的贪得无厌导致了有线电视目前在提供宽带的信息和娱乐服务上取得了领先
的地位。今天的有线电视包含了有关置顶盒的服务,因为只有少数观众接通了有线电视的电
缆。鉴于目前这种盒子已经存在,也广为大众接受,有线电视公司的想法是:只要再增加额
外的功能就可以了。
这个计划有什么不对吗?很简单。即使最保守的广播工程师都同意,电视与电脑的差异
最终将只限于外围设备(peripheral),以及它们在家中摆放在哪一个房间。尽管如此,由
于有线电视业执意垄断,并且不断增强置顶盒的功能,达到可以控制1000个节目的地步
(这样一来,任何时候都有999个你根本没有在看的电视节目),这种远见被出卖了。在有
利可图的数字电视制造争霸战中,目前看来,电脑在第一回合就被击倒了。
但是,电脑将会卷土重来,取得最后的胜利。电脑即电视
我很喜欢问别人记不记得特雷西.基德(TracyKidder)的那本《新机器的灵魂》。然后
我会问读过这本书的人,记不记得书中间题成堆的那家电脑公司叫什么名字。我还没有碰到
过一个答对这个问题的人。数据通用公司(DataGenera1,也就是上述那本书中提到的公
司)、王安(Wang)、普莱电脑(Prime)等公司,都曾经飞速发展,成为一时俊杰,但它
们也都完全忽略了开放系统(opensystem)的重要性。我还记得,在参加这些公司的董事会
时,常常听到人们争辩说,专用系统(proprietarysystem)会带来绝大的竞争优势。如果
你能够制造出一种既受欢迎又独特的系统,就可以让竞争对手无隙可乘。这听起来好像很合
逻辑,但实际上却大错特错。正是这种想法使普莱电脑被淘汰出局,另外两家公司,和其他
许多公司二样,依靠昔日余荫艰难求生。这也是苹果今天不得不改变策略的原因。
“开放系统”是一个至关重要的概念,体现了我们经济体系中的企业家精神。它对专用
系统和到处伸手的垄断提出了强有力的挑战。而且,它正在占据上风。在开放系统中,我们
靠自己的想象力来竞争,而不是靠手中掌握的锁和钥匙。这样做不仅会产生大批成功的企
业,同时也会为消费者提供更加多样化的选择,商业部门更因此变得敏锐而灵活,能够适应
快速的变化和增长。真正的开放系统将为大众所拥有,每个人都将能在其基础上,营造自己
的天空。
个人电脑的飞速发展,使得采取开放式的体系结构的未来电视将等同于一部电脑。就是
这样。置顶盒将变得只有信用卡般大小,只要插入,就可以把你的电脑变成有线电视、电话
或卫星通信的电子通道。换句话说,将来没有人生产电视机,只有电脑工业:它将制造装满
上吨内存并具有强大的信息处理能力的显示器。有些电脑的显示器将不再是18英寸的,而
是能让你欣赏到10英尺的超大屏幕画面。更多的情况下你会和其他人一起观看,而不是自
己一个人观看。但无论你怎么看,它也仍然是一部电脑。
原因是,电脑的影像能力越来越强,也就是说,它拥有良好的配置,可以把影像作为数
据的一种方式,在电脑上加以处理和显示。无论是电信会议(teleconferencing)、多媒体
出版(muliimediapublica-tions),还是一系列的模拟应用(simulaiionapplication),
影像都成为所有电脑不可或缺的一部分。这一切变;是想让观众体会它的一大叫得响的优
势:壮观的体育活动场面近在眼前。在普通电视上,你不大可能真的看到冰上曲棍球运动员
打的是什么球。正因为如此,1988年,日本人在汉城(Seoul)夏季奥运会上,首次推出
“高品质电视”,而欧洲人则利用1992年阿尔贝维尔(Alheriville)冬季奥运会,推出了
他们的HDMAC电视(其后不到一年,这个产品就停止了开发)。
美国的高清晰度电视开发人员己建议,在1996年夏天的亚特兰大(Ailania)奥运会
上,展示封闭式体系结构的新型数字式高清晰度电视系统。问题是,时间已经太晚了,高清
晰度电视很快就会胎死腹中。到时候,没有人会在乎什么高清晰度电视,2000万美国人会
利用他们个人电脑屏幕右上角的小小视窗,观看美国国家广播公司(NBC,
NationaIBroadcastingCompany)的现场转播。英特尔公司和有线新闻电视网(CNN)在
1994年10月,已经共同宣布了要提供这项服务。比特的放送
理解未来电视的关键,是不再把电视当电视看待。从比特的角度来思考电视才能给它带
来最大收益。电影也不过是数据广播的一种特别情况罢了。比特就是比特。
6点钟的晚间新闻不仅能在你需要的时候传送给你,而且也能专门为你编辑,并且让你
随意获取。如果你想在晚上8点17分观看汉弗莱.鲍嘉(HumphreyBogari)的老电影,电话
公司通过双绞线,就可以提供你想要的节目。最终,当你观赏棒球比赛的时候,你可以选择
从球场观众席中的任何位置甚至从棒球抛出的角度来欣赏。这些才是数字化带来的真正变
化,而不是要观众以两倍于现在电视的分辨率去收看“辛菲尔德”(Seinfeld)电视。
当电视数字化以后,将会出现许多新的比特,告诉你关于其他比恃的事情。这些比特可
能只是简单的信息标题,告诉你有关分辨率、扫描速率(scanrate)、屏幕高宽比等情况,
以便让你的电视能够发挥最大功效来处理和显示信号。这些比特可能代表解码算法
(decodinga1gorithm),能力你解读玉米片盒上的条形码(barcode)所代表的奇怪信号。
比特也可能来自十几条声轨(soundtrack)中的一条)让你在观看外国电影时,也能用母语
来收听对白。这些比特也可能是某个钮的控制数据,能让你把调级的(X一rated青少年禁
看的,只供成年人看的)节目转换成限制级的(R一rated,一定年龄以下青少年除有家长
或保护人陪同外不得观看的)或辅导级的(PG一rated,宜在家长指导下观看的)。(反过
来当然也可以。)今天的电视机能让你控制亮度、音量和频道,而明天却能让你改变电视节
目中性与暴力的程度和政治倾向。
大多数电视节目,除了体育赛事和选举结果之外,都不需要实时播出,这一点对数字电
视举足轻重,但是却为大多数人所忽略。这意味着,我们在收看大多数电视节目时,就好像
把资料下载(downloading)到电脑中一样,收看的方式不受比特转换速度的影响。更重要
的是,一旦比特己输入机器中,你不需要依照比特在传输时的顺序来观看节目。突然之间,
电视变成了一种可以随机获取的媒体,更像是一本书或一张报纸,可以浏览,可以调整,不
再局限于某一时间或日期,也不受传送耗时的限制。
一旦我们不再把电视的未来仅仅和高清晰度电视划上等号,开始以最通用的形式——比
特放送(bitradiation),来开创新的局面,电视就变成了一种完全不同的媒体。我们将开
始在信息高速公路上发现许多更有创意的也更迷人的的新应用。除非“比特警察”出来挡我
们的路。
4、比特警察/建立新秩序比特放送执照
信息和娱乐进入家庭有5个途径:卫星、广播、有线电视、电话和经过包装的媒介(例
如磁带、光盘和印刷品等原子)。联邦通信委员会通过管制其中一些途径以及在其中流动的
某些信息内容,来维护大众利益。它的工作难度很大,常常夹在保护和自由、公益和私利、
竞争和垄断之间,障碍重重。
联邦通信委员会主要关注的一个问题,是用于无线通信的频谱。频谱被认为是公共财
产,应当公正地、不受干扰地加以使用,并允许自由竞争,以达到丰富美国人民生活的目
的。这些原则是非常合理的。因为假如缺乏这种监控,像电视信号这样的东西,就会和移动
电话(cellulartelephone)打架,无线电广播也可能干扰了海事通信的甚高频信号。天上
的公路的确也需要一定的空中交通管制。
最近,部分频谱以非常高的价格被拍卖给了移动电话和互动视频公司。而其他某些部分
则免费送人,据说,这些部分是将要用来为公共利益服务的。广告商赞助的电视就是这样的
情况,因为它是“免费”收视的。而实际上,当你购买一盒汰渍洗衣粉(Tide)或其他广告
上宣传的产品时,你等于还是付出了收视费。
联邦通信委员会已经提议,拨给现有的电视公司一个额外“通道”——6兆赫的免费频
谱以供高清晰度电视之用。条件是,电视台必须在15年内归还目前使用的频谱,这一频谱
也是6兆赫的。这也就是说,15年中现在的电视公司可以使用的频谱为12兆赫。联邦通信
委员会的本意是(这个主意当然是可以改变的),给目前的电视台一段过渡期,使其逐渐转
型到未来的电视。6年前,当我们还把电视的发展当成从一个模拟世界进入到另外一个模拟
世界时,这个想法还很有道理;但是,突然地,高清晰度电视也在走向数字化。我们现在知
道了怎样在6兆赫的信道上每秒传输2000万比特,而所有的规则可能在一夕之间完全改头
换面,在某些情况下还会变得完全出乎意料。
想象一下,你自己拥有一家电视台,联邦通信委员会刚刚给你发了执照,准许你每秒传
输2000万比特。你刚得到特批成为本地的比特放送中心。这个执照的原意是让你从事电视
广播,但实际上你会怎样做呢?
诚实点吧。除非万不得已,你才会用它来传送高清晰度电视节目。因为不但这种节目少
而又少,收视人口也不成气候。稍微花点心思,你就会明白,你可以用它来传送4个频道数
字式的、具备演播室效果的NTSC标准电视节目(每个频道的速率都是500万比特/秒),
以此增加潜在的观众人数和广告收入。进一步考虑,你也许会作出另外一种决定,即用
1500万比特/秒的速率传输3个频道的电视节目,把剩下的500万比特/秒的速率用来传
输两种数字式无线电信号,一种作为股票数据广播系统,另外一种提供寻呼服务
(pagingservice)。
到了深夜,当看电视的人数减少时,你可以利用你的执照把比特射入以太,以传送供人
们在家里打印的个人化报纸。到了周未,你感觉分辨率在这个时期变得格外重要了(例如,
要转播足球赛),你会把2000万比特中的1500万拿来作高清晰度电视转输之用。不夸张他
说,在运用这6兆赫频谱或2000万比特时,你就是自己的联邦通信委员会,可以随心所欲
地分配其用途。
当联邦通信委员会建议把新的高清晰度电视频谱分配给现有的广播电视业者以作为过渡
时,委员会官员们脑中浮现的,完全不是这样一种景象。现在拼命想跨入比特放送业的群
体,如果意识到现有的电视台不费吹灰之力,就可以在未来15年中,拥有两倍的频谱和四
倍的广播能力,一定恨不得把这些人给杀了!
这是不是意味着,我们应该派遣“比特警察”来确保新的频谱和它所有的2000万比特
/秒的速率都只用来满足高清晰度电视的需要呢?我不希望这样。
会变脸的比特
在模拟的年代里,联邦通信委员会要分配频谱,比现在容易多了。它只需指着频谱的不
同部分说:这部分给电视,这部分给广播,这部分给移动电话,也就可以了。频谱的每一
块,都代表特定的通信或广播媒介,有各自的特性和异乎寻常之处,但对自己的特定目的则
很清楚。但在数字化世界里,这些差异变得模糊不清,在某些情况下,甚至完全消失:所有
的媒介都由比特组成。尽管有广播比特、电视比特和海事通信比特之分,但无论如何,彼此
全都是比特,都具有多媒体容易混合和用途多样的特性。
未来5年里,电视广播将会发生非比寻常的变化,以致使人难以索解。很难想象联邦通
信委员会能够或将会靠制定高清晰度电视、普通电视、广播等等的比特配额,来管理比特的
使用。市场必然成为更好的调节者。如果把比特用在电视或数据上能赚更多的钱,你就绝不
会把所有2000万比特都用在广播上。你会根据现在是星期几、是一天中的哪个时刻、是不
是假日、有没有特殊活动,来改变你的比特分配方式。具有这样的灵活性至关重要,只有那
些能以最快的速度回应大众并最聪明地运用比特的人,才能成为大众最好的服务者。
在不久的将来,广播业者将会在传输信息的刹那间,才决定把比特通过何种媒介(例
如,是电视还是无线电广播)来传输。当人们谈到“数字融合”(digitalconvergence)或
比特放送时,正是指的这种情况。信息传输者会告诉接收者,“我们传送的是电视比特、广
播比特或现在传送的比特代表的是《华尔街日报》的内容。”在更遥远的将来,当比特离开
传输端时,将不再局限于任何具体的媒介。
以天气预报为例。将来传送给你的将是一个有关天气状况的电脑模型,而不是传统的由
气象播报员拿着地图和曲线图解说的老一套。关于气象的比特抵达你的电脑电视之后,位于
接收端的你,直接或间接地运用电脑的智慧,将比特转换成为有声的报告、印制出的地图,
或是你喜爱的迪斯尼卡通人物。聪明的电视机可以按照你喜欢的各种方式来完成这件工作,
甚至可以随着你当时的情绪和意向而变换不同的面貌。在这个例子中,传送信息的传播业者
根本不知道传送出去的比特最终会以何种面目——影像、声音,还是印刷品——在接收端出
现。这由你决定。
这就是真正意义上的数据播放(datacasting)和比特播放,它超越了我们今天的管制
范围,这种管制假定信息传输者知道自己发出的到底是电视、广播还是数据信号。
很多读者也许都把我说的“比特警察”,当作和“内容检查制度”差不多的东西来理
解。并非如此。消费者将扮演内容检查员的角色,他可以告诉接收器选择哪类比特。比特警
察出于习惯,想要控制媒介本身,这真是毫无意义。问题在于(这是个非常政治化的问
题),联邦通信委员会提议把频谱拨给高清晰度电视使用,看起来有点像施舍。尽管委员会
无意制造意外之财,特殊利益集团却决不会善罢甘休,因为这样一来,原本拥有大量带宽的
人将会得到更多的带宽。
我相信联邦通信委员会不会笨得想当比特警察。它的任务是让先进的信息和娱乐服务在
符合大众利益的情况下得到更多的发展。即使早期的少数大无畏的数据传播者可能会被华盛
顿的官僚们生吞下去,但谁也无法限制比特放送自由,就像古罗马人无法阻止基督教的传播
一样。
跨媒体经营
想想现代的报纸制作过程吧。记者通过电子邮件把报道内容传给报社,由计算机作文字
处理。照片都是数字化的,也常常通过连线作业传送。版面设计由计算机辅助设计系统包
办,它准备好全部的数据以制成胶片,或是直接制版。也就是说,从头到尾,报纸的整个概
念和结构都数字化了,只有最后一步,即把墨水压到纸上除外。在这最后一步里,比特变成
了原子。
现在,假设最后一步不是在印刷厂中进行,而是把比特以其本来形式直接传送给你。你
可能为了方便,选择在家中把它打印出来(最好用再生纸,这样我们就都不必消耗那么多空
白的新闻纸了)。你也可能宁愿把它下载到膝上型或掌上型电脑,或有朝一日,把它下载到
你完全可以随心所欲操作的、只有1%英寸厚、全色彩、分辨率极高,而且防水的显示器上
(它也许看起来恰似一张纸,并且有纸的味道,如果这样使你感到带劲的话)。不过,尽管
传送比特的方式有很多,其中绝对少不了广播。电视广播可以向你传送报纸比特。
哎呀,这可糟了。一般说来,跨媒体经营的法令规定,业者不能在同一个地方,同时拥
有报纸和电视台。在模拟的年代里,最容易的防止垄断、保障多元化的办法,就是限定经营
者在任何一个城市中只能拥有一种媒体。媒体的多元化意味着内容的多元化。所以,假如你
拥有一家报纸,你就不能再拥有一家电视台,反之亦然。
1987年,参议员泰德.肯尼迪(TedKennedy)和欧内斯特.赫林斯(ErnesiHollings)
在预算决议中增加了一个追加条款,防止联邦通信委员会随便延长暂时搁置跨媒体经营管制
的时间。这一条款主要针对鲁琅特.默多克(RuperiMurdoch),他在波士顿(Bosion)已拥
有一家超高频电台,后来又在那里买下一家报纸。这个专门针对默多克的法案被称为“激光
束法案”(1aserbeamlaw),几个月后就被法庭推翻了,但国会禁止联邦通信委员会改变或
放弃跨媒体经营管制的决议仍然有效。
在同一个地方同时拥有报纸比特和电视比特,真的应该算违法吗?假如在复杂而又个人
化的多媒体信息系统中,报纸比特不过是电视比特的延伸,又该怎么办呢?混合的比特,和
以不同深度表现、不同品质显示的报道,只会使消费者得益。如果继续执行现有的跨媒体经
营政策,美国公民岂不是被剥夺了享受尽可能丰富的信息的机会?如果我们禁止某些比特相
互混合,就是在荒唐地自欺欺人。
有保障的多元化并不像人们想象的那样,依靠繁琐的法规而存在。这是因为,大一统的
大众传媒帝国正逐步瓦解,分割为许许多多的家庭工业。随着我们开始上网,并传输越来越
多的比特和越来越少的原子,拥有印刷厂将不再是什么了不起的事情。甚至在世界各地都派
有常驻记者也不再那么重要,因为才华横溢的自由撰稿人已经发现,通过电子网络,他们可
以直达你家。
今天的传媒巨子,明天拼命也难抓牢他们的中央集权媒体帝国。我坚信到了2005年的
时候,美国人花在互联网络(不管那时人们怎么称呼它)上的时间,要大大超过他们收看电
视网的时间。技术和人类天性的聚合力量,将比任何国会法案都更能促进多元化的发展,但
是,万一我对未来的判断有误,而且为了暂时的过渡阶段着想,联邦通信委员会最好还是发
挥想象力,寻找到一种代替工业化时代跨媒体经营法令的办法,以为数字化提供更多的激励
和指导。保护比特?
著作权法(copyright1aw)已经完全过时了。它是谷登堡时代的产物。由于目前的著作
权保护完全是个被动的过程,因此或许我们在修正著作权法之前,得先把它完全颠覆。
大多数人都从复制的容易程度这个视角,对著作权表示担心。在数字化世界里,你要担
心的不仅是容不容易复制的问题,还得考虑一个事实:数字化拷贝不仅和原件一样完美,甚
至,经由一些奇特的处理,拷贝可能会比原件更好。就像比特串的错误可以修改一样,拷贝
可以清理、改进,噪音可以去除。于是,拷贝变得完美元缺。音乐产业就深明这个道理,因
此对好几种消费电子产品都迟迟不予推出,其中包括著名的数字录音带。乍看之下,这么做
好像没什么道理,因为即使在拷贝品质不佳的时候,非法盗版依然猖撅。在一些国家中,市
面上销售的录像带中,有95%都是盗版。
今天,不同媒体对著作权的管理方式和态度可谓大相径庭。音乐界的情况广受国际瞩
目,因此词曲创作者和演奏人员能够获得多年版税。“祝你生日快乐”的旋律已经是公共财
产了,但是假如你希望在电影的某个场景中使用其歌词,你还必须付给华纳/查帕尔
(Warner/Chappell)使用费。这似乎不合逻辑,但却是保护音乐作者和演奏者的复杂体系
的一部分。
相反,对画家而言,作品一旦卖出,几乎就和他断绝了关系。依照观赏次数收费是不可
能的。另一方面,在有些地方,把画拆成一部分一部分来卖,或未经画家允许,就把画复制
在地毯或沙滩浴巾上,依然完全合法。美国直到1990年才制定了“.视觉艺术家权利法
案”(VisuaIArtisisRightsAct),来制止这类破坏行为。所以,即使在模拟世界中,目前
的制度也并非存在已久,不偏不倚。这样算不算盗版呢?
在数字化世界中,这样算不算盗版呢?问题已不在于拷贝是否容易,以及拷贝是否更逼
真。我们将看到一种新的欺骗行为,简直已经不能再叫做欺骗了。当我在互联网络上读到一
篇东西时,抱着平常读报、剪报的心理,我想把它复制一份送给一个人,或通过邮件发送清
单(mailinglist)送给一群人阅读,这似乎无伤大雅。但是,只要再多敲几下键盘,我就
可以把这篇文章传送给全球各地的几千人看(这和剪报的情形大不相同)。剪取比特和剪取
原子可是有着天壤之别!
在今天的非理性互联网络经济体系中,采取上述的举动几乎不必破费一文钱。没有人很
清楚地知道,在互联网络上谁要付钱,为什么而付钱,但对大多数用户来说,它似乎是免费
的。即使将来情况有所改变,在互联网络上建立起了一种理性的经济模式,要把100万比特
散发给100万人,可能也只需要花一两分钱。这种收费标准肯定不会像普通邮资或联邦快递
的运费一样,因为那些标准都是建立在运送原子的基础之上的。
而且,阅读者将不仅是人,也有计算机程序;例如,它们会通读本书,并自动整理出一
份摘要。著作权法规定,如果你对材料进行了总结整理,那么,这份总结的知识产权将归你
所有。我怀疑立法者有没有想过,动手搞摘要总结的可能是没有生命的实体或是盗版机器
人。
在美国,专利是由商务部来管理的,而著作权则完全不同,是由国会图书馆来管理的。
和专利法不同的是,著作权法保护的是构想的表现及其形式,而不是构想本身。这很好。
但是,当我们所传输的比特实际上并没有特定形式时,例如前面提到过的天气预报数据
就是这样情况,那该怎么办呢?要让我说出天气预报的计算机模型算不算天气的一种表现形
式,这实在是有点难为我。事实上,对一个完整而有效的计算机气象模型的最好描述是,它
是一种对天气的模拟,它能够最大程度地接近于“实际情况”。当然,“实际情况”就是事
物本身,而不是事物的一种表现。
天气的表现方式包括:以抑扬顿挫的语调“说明”天气状况的声音,一张有颜色、会动
的可以“显示”天气状况的动画图表,或是能够打印出来的、用图解的方式“描绘”天气状
况的气象图。这些表现方式都不是数据的内在组成部分,而是由一台半智能型(或智能型)
机器具体制作出来的。而且,它们可能反映了你本人和你的品味,而不是那些地方性的、全
国的或国际性的气象播报员的口味。这完全不涉及到传输端的著作权问题。
再以股市为例。股价每分钟的波动状况可以用不同的方式组合。数据本身,像电话公司
的电话号码簿一样,是没有著作权的。但是,描绘某一支股票或一组股票的走势图是绝对可
以享有著作权的。而这种数据表现形式正越来越多地由接收端而不是传输端来赋予,因此使
著作权保护的问题益发复杂。这种“不具特定形式的数据”,能在多大程度上推广到更特殊
的材料上呢?它能用在新闻报道上(有可能)呢,还是小说上(比较难于想象)呢?当比特
就是比特的时候,我们会碰到一堆新问题,而不只是盗版这种老问题。
媒介不再是讯息。
5、随心所欲多媒体新瓶袋旧酒
在短短一年之间,麦当娜(Madonna)创出了12亿美元的销售佳绩,这引起了时代一华
纳公司(TimeWarner)的注意,因此,它在1992年与这位34岁的前密执安啦啦队长签订了
价值6000万美元的“多媒体”合约。当时,看到人们用“多媒体”来形容互不相于的传统
的印刷品、唱片和电影的大杂烩,我惊讶无比。从那以后,我几乎每天都在《华尔街日报》
上看到这个词,通常都用作形容词,意思囊括了“互动的”、“数字的”和“宽带的”等等
所有东西。一篇报道的标题是《唱片店让位于多媒体商店》。似乎假如你身处信息和娱乐服
务业,而居然还没有制定跨入多媒体的计划的话,你很快就要没戏唱了。这究竟是怎么回事
呢?
多媒体一方面代表新的内容,一方面也代表用不同的方式来看旧内容。多媒体即是本质
上互动的媒体,随着比特数字通用语的出现而产生。同时,它也与计算机成本降低、威力增
大和呈爆炸式增长的局面息息相关。
媒介公司千方百计地想要销出它们的旧比特(包括麦当娜的畅销歌曲),在它们的推波
助澜之下,多媒体的技术影响日益加大,也就是说,媒介公司不但重新启用了音乐和电影资
料馆里的收藏,而且更扩大了声音和影像的使用,并把它们同数据结合起来,以备式各样的
包装,通过多种渠道,将其运用在各种可能的用途上。所有公司都下定决心,重新规划旧比
特,期望以低成本获取高利润。
假如制作30分钟的情景喜剧要花去哥伦比亚广播公司(CBS,
Co1umbiaBroadcastingSystem)或福克斯广播公司(Fox)50万美元,那么脑筋再不灵的人
也会想到,如果重新启用现有资料库里的东西,比如说1万小时的影片,将是一笔上好的买
卖。即使你保守地把旧比特的价值估计为新影片的1/5,你的收藏都值2亿美元。蛮不错
嘛!
每当新媒体诞生时,都必然会出现这种新瓶装旧酒的现象。电影改编舞台剧、收音机重
播演出实况,以及电视台重播旧电影的现象比比皆是。因此,好莱坞迫不及待地想把旧影片
改头换面,或把它们同音乐、文字融合在一起,也就不足为奇了。问题是,应伴随着这种新
媒体而来的真正多媒体素材,在早期却难以得到。真正能够利用多媒体的优势,并且能定义
多媒体的信息和娱乐服务业,需要一段时间才能发展起来。其发育期必须足够长,以使它能
够总结成功经验,吸取失败教训。因此,今天的多媒体产品就好像是具有优良基因的新生
儿,还没有发育成熟、形成强健的体魄和独特的个性。大多数多媒体应用都有点贫血,不过
是一种或另一种形式的投机而已。
但是,我们学得很快。摩登电子夜总会
纵观历史,新媒体的孵化可能需要很长的时间。曾经,电影、工作者花了很多年才想到
可以移动电影摄影机(moviecamera),而不是仅仅让演员在镜头前移来晃去。又经过了32
年,他们才想到为影片加上声音。新的构想时不时地冒出来,为电影和电视业增添了许多新
内容。多媒体的发展也会经历同样的过程。在我们发展出健全的概念之前,反刍旧比特的情
况将会不断重演。对《小鹿斑比》(Bambi)这样的比特而言,这种处理方式还可以接受,
但对《魔鬼终结者第二集》(Terminator2)这类影片而言,新瓶装旧酒可就不够精彩了。
多媒体光盘(一种原子形式)在儿童市场上特别受到欢迎,因为孩子们格外喜欢一遍又
一遍地看或听同样的故事。我在1978年买了先锋公司(Pioneer)首次推出的激光影碟机,
当时,以激光碟形式存在的影片只有一部,即《追追追》。我的8岁的儿子早就准备好要把
这部电影看上几百遍,后来,他真的把它看得滚瓜烂熟,甚至连一些极细微的剪接错误的镜
头,都逃不过他的法眼。例如,在其中一个画面中,演员杰基.葛里森站在车门的一边,在
下一个画面中,他却移到了车门的另一边。这类失误在每秒出现30帧画面的速度下,往往
难以觉察。而在后来发行的《大自鲨》中,我儿子也花了无数时间,在一个画面中找到了鲨
鱼身上的电线。
在这段时间里,“多媒体”的意思是五光十色的摩登电子夜总会,摇滚乐和光影相映生
辉。美国国防部曾特别要求我在一份项目建议书上删去“多媒体”字样,唯恐我会从威廉.
普罗斯麦参议员手中拿到臭名昭著的“金羊毛奖”。这个奖项每年都颁发给钱花得最冤的政
府资助研究项目,并因此惹来许多负面报道。(1979年12月,当时的教育局就不那么走
运:一位研究人员因为花了219592美元来编写教大学生如何看电视的一揽子教程而荣获金
羊毛奖。)
但当我们在电脑屏幕上展示配有彩色插图的文件时,所有的人都看得目瞪口呆,因为只
要他们用手指一碰插图,插图就会立即变成有声电影。那一时期的实验效果尽管稍差,但却
开了个好头,今天的一些最好的多媒体产品都是当时那些实验的高价值翻版。多媒体诞生了
1976年7月3日深夜,以色列在乌于达的恩德培机场发动了一次极为成功的奇袭,一
举救出了被亲巴勒斯但游击队扣押的103名以色列入质,当时乌于达独裁者伊迪.阿明
(IdiAmin)为这些游击队提供了安全庇护。在1小时的救援行动中,以色列士兵击毙了20
到40名乌于达士兵,7名劫机者也全部身亡,但只有1名以色列士兵和3名人质丧生。
这次奇袭给美国军方留下了深刻的印象,它要求高级研究计划署调查如何以电子方式,
让美国突击队也接受使以色列入得以在恩德培冒险取胜的训练。
以色列入的做法是在沙漠中按照一定比例建造一座恩德培机场的实体模型(这对以色列
入来说易如反掌,因为这个机场是当以色列和乌于达的关等还十分友好时,由以色列工程师
设计的)。然后,突击队在精确的模拟环境中,演练登陆和撤离,乃至实战攻击。在他们抵
达乌于达展开实际行动之前,他们已经对恩德培机场了如指掌,可以在现场表现得和当地人
没什么两样。这个办法真是既简单、又绝妙!
然而,建造实体模型的办法并不具有普遍意义,因为我们不可能挨个模拟人质被扣的环
境,或逐一复制可能成为恐怖分于目标的机场和大使馆建筑。我们需要用电脑来做这件事。
这一回,我们又得使用比特而不是原子。但是单靠类似飞行模拟器中使用的电脑制图,显然
是不够的。无论我们发展出什么系统,都必须具有好莱坞电影布景般的逼真度,以造出一种
实地氛围和对周围环境的真实感觉。
我和我的同事提出了一种简单的解决办法。这就是,利用影碟让使用者在开车的时候,
觉得好像在驶过真正的街道。我们选择了科罗拉多州(Co1orado)的阿斯彭山作为试验点
(冒着获金羊毛奖的危险),觉得当地的街道排列和城市规模还算简单,可以应付得来;同
时,住在那儿的人也相当古怪,当我们在不同的季节里,花几个星期的时间,驾着一辆自制
的摄影车穿梭于大街小巷时,他们竟丝毫不以为意。
这个系统运作的方式很简单。我们从不同的方向拍摄每一条街道,每3英尺就拍一个画
面。同样地,我们也从两个不同的方向拍摄每个转弯处。通过把笔直的街道录在一张影碟
上,而把弯道录在另一张影碟上,电脑能够天衣无缝地为你提供驾驶经验。当你在影碟机甲
所播放的影碟中,把车子开到十字路口时,影碟机乙会在这个路口待命。一旦你决定了要向
右转或向左转,影碟机乙会放映出你所选择的转弯方向的画面。当你忙着转弯时,影碟机甲
正好趁这个空当,寻找你转弯后将要进入的直道的画面,待转弯完毕,影碟机甲又会巧妙地
带你驶过笔直的新街道。
在1978年那个时候,阿斯彭计划简直像魔术一般。你可以从车窗里望出去,停在一座
建筑物前面(譬如警察局),一直走进去,与警察局长交谈;可以选择不同的季节,再看看
40年前的建筑物是什么样子。你还可以参加有导游的游览活动,乘坐直升机俯瞰城市,把
整个城市变成动画,到酒吧里买醉;同时,留下足迹,像阿里阿德涅的线团一样,让它带你
回到最初的起点。
“多媒体”由是诞生。
由于这个计划的成功,美国军方特意请人承包建造实地工作模型,想要对抗恐怖分子的
攻击,保护使馆和机场。具有讽刺意义的,他们第一个要模拟的地方就是德黑兰。可惜!还
是慢了一步。90年代的Beta系统
今天,大多数的多媒体产品都以光盘的形式发行,面向消费市场,美国大多数5到10
岁的孩子和越来越多的成年人都使用过光盘。1994年圣诞节期间,美国市面上出现了2000
余种消费性光盘。而现在全球各式各样的光盘大约超过10000种。1995年,几乎每台卖出
去的微机都装有光盘驱动器。
用作只读存储器(ROM,read一on1ymemory)的光盘,今天其容量可达50亿比特(只
能单面使用,因为这样容易生产)。未来几年内,单面光盘的存储容量可以提高到500亿比
特。考虑到一份《华尔街日报》大约包含1000万比特,50亿比特已经是个十分庞大的数目
了(这样的话,一张光盘就可以容纳将近两年的《华尔街日报》的内容)。换个角度想,一
张光盘代表了大约500本古典名著的容量,即使是那些一星期能读两本小说的人,这些书也
够他们读5年的。
但从另一个角度看,50亿比特也并不那么多;它只不过相当于1小时的压缩影像。如
此说来,50亿比特的容量往大了说也不过是刚刚好而已。短期可能出现的情况是,光盘会
大量使用文字棗这在比特运用上比较经济——以及许多静止画面(siill),外加一些声
音,而后动的影像却只是一些片断。具有讽刺意味的是,照这样发展,光盘会让我们读得更
多,而不是更少。
然而,从长远来看,决定多媒体前途的,不是这种成本只有半个美金的塑料盘,或50
亿乃至500亿比特的光盘容量,而将是日益壮大的联机系统(onlinesystems),其容量实
际上没有止境。《连线》杂志的创办人路易斯.罗塞托(LouisRossetto)将光盘只读存储器
形容为“90年代的Beta系统”,意思是它像Beta制大尺寸磁带录像系统(Betamax)一
样,最终难逃没落噩运。
他说得没错,往长远看,多媒体将主要是一种网络现象。不过,尽管上网和自己拥有光
盘只读存储器有经济模式上的不同,但通过宽带传输,两者的功能却不分轩轾。
无论采取哪一种方式,多媒体都将为编辑工作带来根本性的变化,因为在深度和广度
上,将不会再有顾此失彼之憾。当你购买印出来的百科全书、世界地图集,或关于动物王国
的书籍时,你希望看到的是对广泛话题的包罗万象的描述。相反,当你买一本谈威廉.退尔
(WilliamTell)、阿留申群岛(Aleutianisl-ands)或袋鼠的书时,则希望得到关于这个
人、这个地方或这种动物的深度介绍。在原子的世界里,物理上的限制使人们无法同等兼顾
深度与广度,否则的话,你想要的书可能厚达1英里。
在数字世界中,深度/广度问题消失了,读者和作者都可以自由优游于一般性的概述和
特定的细节之间。事实上,“多告诉我一些”(tellmemore)这一概念正是多媒体十分重要
的组成部分之一,同时它也是“超媒体”(hypermedia)的根基。没有页码的书
“超媒体”是“超文本”(hypertext)的延伸,超文本这个词指的是互联程度很高的
文字叙述,或具有内在联系的信息。这个“构想脱胎于道格拉斯.恩格巴特
(DouglasEnglebart)在斯但福研究院所作的实验,名称则源于泰德.尼尔森(T一
Nelson)于1965年左右在布朗大学(BrownUniversity)的研究。在印刷的书籍中,句子、
段落、页码、章节、按顺序排开,这一顺序由作者决定,同时也由书籍本身的物理序列结构
所决定。尽管你可以任意翻阅一本书,你的视线可以随心所欲地停留在书中的任一部分,但
是书籍本身仍然永远受限于物理的三维空间(threedimensions)。
数字世界的情况却全然不同;信息空间完全不受三维空间的限制,要表达一个构想或一
连串想法,可以通过一组多维指针(pointer),来进一步引申或辩明。阅读者可以选择激
活某一构想的引申部分,也可以完全不予理睬。整个文字结构仿佛一个复杂的分子模型,大
块信息可以被重新组合,句子可以扩张,字词则可以当场给出定义(希望在这本书中,你还
不需要大多的定义)。这些连接可以由作者在“出版”著作时自行嵌入,也可以在出版后,
由读者在以后的时间里陆续完成。
你可以把超媒体想象成一系列可随读者的行动而延伸或缩减的收放自如的讯息。各种观
念都可以被打开,从多种不同的层面予以详尽分析。我能想到的最好的纸张对应物是基督降
临节的日历。但是,当你开启了小小的电子(而不是纸张)之门时,你看到的可能是一个因
情境不同而情节各异的故事;或者,就像在理发店两排相对的大镜子里一样,看到的是影像
之中的影像之中的影像。
所有的多媒体都隐含了互动的功能。如果你想要的只是被动的经验,那么闭路字幕电视
(c1osed-cap-tionedte1evision)和打上字幕的电影早已符合了结合影像、声音和数据的
多媒体定义。
多媒体产品不仅包括互动式电视(interactivetelevision),也包括能够放映影像的
电脑(videoenab-1edcomputer)。正如我们先前所说的,两者的差异极小,而且还在变得
更小,最终将合二为一。许多人(特别是家长)把“互动视频”(interactivevideo)想成
任天堂(Nin、endo)和世嘉(Sega)及其他厂家出产的激烈的电子游戏。有些电子游戏需
要剧烈的身体动作,必须换上运动服才能玩。然而,操作未来的电视却不一定需要长跑布谷
那样的高强体能,或是简.方达(JaneFonda)的矫健身手。
今天,由于多媒体设备仍很笨重,我们多半是在书房或起居室中操作多媒体。即使出现
了膝上型电脑,其蚌壳式设计仍然使它无法成为非常个人化的信息设备。一旦我们有了小而
薄、明亮、灵活、分辨率高的显示器以后,情况就会完全改观。多媒体会变得更像一本书,
你可以蜡缩在床上摆弄它,通过它和别人对话,或是听一段故事。有朝一日,多媒体会让你
感觉像纸一样轻巧,像皮革一样味道丰富。
很重要的一点是,不要只把多媒体视为个人世界的博览会,或是结合了影像、声音和数
据的“声光飨宴”。多媒体领域真正的前进方向,是随心所欲地从一种媒介转换到另一种媒
介。优游不同的感官
世界在数字世界里,媒介不再是讯息。它是讯息的化身。一条讯息可能有多个化身,从
相同的数据中自然生成,将来,广播公司将会传送出一连串比特,像前面提到过的天气预报
的情形一样,让接收者以各种不同的方式加以转换。观众可以从许多视角来看同样的比特。
以体育运动为例。你的电脑电视可以把接收到的足球比特转换成录像供你观赏;也可以
用声音的方式来接收这些比特,让你收听体育节目主持人的转播;或者干脆把比赛的图解演
给你看。在每一种情况下,你收看的都是同一场球赛和同一堆比特。当这些比特单单被转换
为声音时,声音媒介迫使你只能边听边想象球员的动作,但却不会耽误你开车。当比特被转
换为录像时,发挥想象的余地少多了,但你却很难看清球队的技战术,因为球赛中场面混
乱,还常有人压人的景象。在比特被转换为图解的时候,这个问题就迎刃而解了,双方的攻
防策略一览无余。在这三种媒介转换方式之间来回游动是可能的。
一张关于昆虫学的光盘,可以作为另外一个例子。这张光盘的结构会更像一家游乐场而
不是一本书。不同的人可以用不同的方式来探索光盘的内涵。最好能以线条画出蚊子的结
构,以动画表现蚊子的飞行动作,而以声音表达出它的嗡嗡叫声。但是,我们不需要为每一
种表现方式建立不同的数据库,或让每一种方式都成为个别创造的多媒体经验。这种种方式
可以出自同一个来源,并且能从一种媒介转换成另一种媒介。
思考多媒体的时候,下面这些观念是必不可少的,即:它必须能从一种媒介流动到另一
种媒介;它必须能以不同的方式述说同一件事愉它必须能触动各种不同的人类感官经验。。
踝我第一次说的”彬,你没听明包刃以就让我(机器)换个方式,用卡通或三维立体图解演
给你看。这种媒介的流动可以无所不包,从附加文字说明的电影,到能柔声读给你听的书
籍,应有尽有。这种书甚至还会在你打瞌睡时,把音量放大。跳跃的静态照片
在这种从一种媒体自动转换为另一种媒体的过程中,最近的一大突破是沃尔特.本德
(Wa1ierBede)和他的学生在媒体实验室中取得的。他们的研究叫做“跳跃的静态照片”他
们提出的问题是,怎样才能把数秒钟内出现的影像当作静态照片印出来,并使这个静止影像
的分辨率比任何一幅单独画面都高出一个数量级呢?8毫米录像的任一幅画面的分辨率都只
有200多条扫描线,与35毫米的幻灯片比起来(它有1000多条扫描线),显得很低。答案
是,把分辨率从冲司中抽离出来,瞬时往前和往后多看几个画面。
结果,他们研究出了一种可以从寒酸的8毫米录像中产生非常高品质的影像照片(3策
4英寸柯达彩色照片)的工艺。这些静态照片的分辨率超过5000条线。这意味着从美国人
藏在鞋盒里的数十亿小时的8毫米家庭录像片中筛选出的片断,可以转化为肖像照或是圣诞
卡片,或是印出来存放在相册中,其分辨率与一般的35毫米快照没什么两样,甚至更胜一
筹。
你可以从CNN的电视胶片(footage)中把突发新闻的画面录下来,放在报纸的头版
上,或作为《时代》杂志的封面、不必再依赖我们过去有时会看到的那些模糊图片了,它给
人的感觉仿佛是透过一个脏兮兮的铁栅看世界。
“跳跃的静态照片”实际上是从来不曾存在过的影像,它代表的是从好几秒的画面中制
成的一幅静止画面。在这段时间内,摄像机镜头可能已伸缩或移动,画面中的物体也许亦变
换了位置。尽管如此,得到的影像仍然光彩夺目,毫不含糊,分辨率奇高。这种静态照片从
某种程度上说反映了摄制者的真实意图,因为它在摄像机快速移近或移开的地方加进了更高
的分辨率,也在镜头摇摄时,拉大了景宽。运用本德的方法,快速移动的元素,如一个人走
过舞台,会被舍弃,而代之以暂时稳定的元素。
这种“多媒体”的例子包含了从一维(时间)转换到另一维(空间)的经验。最简单的
例子就是当我们把演讲(声音的范畴)整理成印刷品(文字的范畴)时,用标点符号来表示
其中的抑扬顿挫。或者是在一部剧本的对白旁附加许多表演提示,帮助演员掌握这个剧的调
子。这些形式都可归入多媒体的范围之内,只不过常常被人忽略。但是,它们也是这个庞大
事业的一部分。
6、产业大变革/比特市场没有比特,就没有前途
谈到预测和发动变革时,我认为自己是个极端主义者。即使这样,当变革事关技术、法
令和新的服务业的发展时,事情的演变速度还是快得超出我的想象——电子公路上显然没有
速度限制。这有点像以时速160公里行驶在高速路上一般。我刚刚弄明白自己的车速有多
快,呼的一下,一辆奔驰急驰而过,接着又是一辆,然后第三辆又绝尘而去。哇!它们的时
速一定有120英里。这就是信息高速路快车道上的生活。
尽管变动的速度比过去任何时候都快,带动创新步调的却不再是晶体管。微处理器或光
纤等科学突破,而是像移动计算、全球网络和多媒体这样的新的应用。这部分地是因为现代
芯片的装配设备成本高得令人咋舌,非常需要以各种新的应用方式,来消耗芯片中所有的计
算能力和存储容量;同时,这也是基于在硬件开发的许多领域,我们已经非常接近物理极限
了。
光波行进:英尺需要大约十亿分之一秒,这个事实不太可能改变。当我们把电脑芯片越
做越小时,它们的速度可能会加快一点,但要想在电脑的整体威力上有大的突破,就必须设
计新的解决方案,例如,让许多机器同时运行。目前,电脑和电信上的重大变化都来自于应
用层面,这种变化根源于人类的基本需求,而不是基本的材料科学。华尔街也注意到了这一
点。
最近,素负盛名的作家兼工程师、贝尔科公司(它从前是7家小贝尔公司唯一的研究机
构)负责应用研究的副总裁鲍勃.拉基(BobLuck)提到,他不再依赖阅读学术出版物,来了
解最新的科技发展,而是求助于阅读《华尔街日报》。假如你想眺望“比特”产业的未来,
最好的办法之一就是把望远镜的三脚架分别伸入美国的企业、商业界和法规制定部门,在纽
约证券交易所,美国证券交易所和全国证券交易商协会自动报价表手统都插上一脚。
当QVC公司和维康公司(Viacom)争相收购派拉蒙公司时,分析家曾宣称赢家也将是输
家。不错,派拉蒙、自从维康向其求婚后,财务状况一路直线下滑,但即使这样,它仍然是
维康心中的尤物,因为它现在拥有的比特种类更广泛了,无论是萨姆纳.瑞德斯顿(维康公
司老板)还是巴里.迪勒(派拉蒙老板)都很清楚,假如你的公司只制造一种比特前途就炭
发可危、派拉蒙的故事是关于比特的,和老板们的自尊心无关。
比特的价值很大一部分要看它能不能重复使用。从这个角度上看,米老鼠比特可能要比
阿甘(ForrestGump)比特值钱得多…米老鼠比特甚至会以冰棒的形式出现(成为可消耗的
原子)。更有趣的是,每1小时就会有超过12500个新生命在不断壮大迪斯尼(Dlsney)忠
实观众的阵营。1994年,迪斯尼的市场价值是20亿美元,远胜于贝尔大西洋公司
(BellAtlantic),尽管后者的销售额比迪斯尼高出50%,利润也是它的两倍。
比特的运送
运送比特是比深陷杀价竞争泥潭的民航业还要糟糕的生意。电信业受制到了非常厉害的
程度:尼奈克斯公司只能在纽约市布鲁克林区(Brook1yn)最阴暗的角落设置电话亭这种电
话亭的寿命只有48小时,而不受管制的竞争者却可以把电话亭设在繁华的第五大道和公园
大道上,乃至航空俱乐部的休息室中。
更糟的是,电信业的整个价格体系都即将瓦解。今天的通信费用是由通信的时间、距离
的长短或比特的数量来决定的,这三种标准很快都将成为空头标准。现有体系在时间(从1
微秒到1天)、距离(从1英尺到50000英里)和比特(从1比特到200亿比特)三方面的
各种极端情况的冲击下,正在出现巨大的裂缝。过去,当各方面的差异还没有这么极端化
时,这种体系运行得还不错。当你使用9600比特/秒的调制解调器时,会比2400比特/秒
的调制解调器通信时间更短,因而可以少付75%的费用。但是,谁会在意其中的差别呢?
然而,现在影响面扩大了,我们的确很在意费用的差距。以时间为例,假如不考虑传输
速度和比特数量的话,是不是我就得相信看两小时电影和进行30次不同的为时4分钟的通
话,应该付同样的钱呢?假如我可以用125万比特/秒的速率发传真,那么,我需要付的费
用真的只有目前传真价的1/125吗?假如我在采用非对称数字用户环线的电影频道上,以
16000比特/秒的速率附带传输声音的话,我真的只需要为两小时的通话付5分钱吗?假如
我岳母出院回家的时候,带着一个远程监控的心脏起搏器,必须利用一条通到医院的开放线
路,以便医院每小时监控几个随机布置的比特,我们能像计算《乱世佳人》影片的120亿比
特的传输费用一样,为这类比特计费吗?试着弄清楚这个商业模式看看!
我们必须发展出一套更聪明的办法。这种办法可能不是把时间、距离或比特数当作主要
变数和计费标准。也许应该让大家免费使用带宽。我们根据所购之物的价值来购买电影、远
程健康监控设备和文件,支付的费用中并不包括传输信道费。如果根据玩具中所包含的原子
数量,来决定玩具的出售价格的话,未免有些不近情理。现在该是好好了解比特和原子所代
表的意义的时候了。
如果一家电信公司的管理层,将公司的长远战略仅仅局限在运送比特上,那绝对不符合
股东的最大利益。拥有比特或使用比特的权利,以及大大提高比特的附加价值,都必须是公
司长远战略的一部分。否则的话,将无法增加收益,电话公司会面临灭顶之灾。因为,在这
一行业中,电话服务正迅速变为一种商品,其价格由于激烈的竞争和越来越多的带宽而日益
跌落。
在我逐渐长大成人的时候,每个人都痛恨电话公司(成年后,我把保险公司列为第一讨
厌的东西)。50年代,每个小孩肚子里几乎都藏着一些骗电话公司的诡计,大家都把它当
成冒险游戏一样,乐此不疲。今天,有线电视公司荣幸地成为新靶子,因为许多有线电视公
司服务不佳,却还不断涨价。更糟的是,他们并不是“大众传输工具”,这帮人还控制着线
路中的传输内容。
由于最初开播有线电视的本意是进行多种社区服务,有线电视业享尽了不受管制的垄断
行业的种种好处。当有线电视经营者开始组合、发展成为全国性网络时,人们才注意到这些
公司确实不仅控制了电信通道,同时也控制了传播内容。和电话公司大不相同的是,除非在
地方性和社区性服务上,它没有义务提供“路权”(right-of-way).。
电话业的管制建立在一个简单的原则基础之上:每个人都有权使用电话线路。但是,假
如宽带系统比较接近今天的有线电视。系统而不是电话网络的话,那么情势就变得暖昧不明
了。假如给予他们选择机会,频道拥有者是否会欣然迎纳节目内容的拥有者,而置公平的原
则于不顾呢?对此,美国国会怀有深深的不安。假如你既拥有频道,又能掌握传播内容,你
还能维持超然的立场吗?
换句话说,假如美国电话电报公司和迪斯尼公司合并的话,小朋友观赏迪斯尼出品的米
老鼠卡通,是不是就会比观赏兔宝宝(BugsBunny)卡通便宜许多?跟谁结盟?
1993年秋,当贝尔大西洋公司同意以214亿美元,买下有线电视巨头电信公司时,研
究“信息高速公路”的学者都把它视作一个重要信号:数字化时代真正到来了!这次购并仿
佛就是剪彩仪式。
然而,这一购并不仅有悸于相关法规的逻辑,也有违常识。电话和有线电视从来就是对
头,法规也排除同时经营这两类业务的可能性,并且,环状和星状网络更是水火不相容。此
举单单投资水平之高就已令人膛目结舌。
4个月后,当贝尔大西洋公司与电信公司的交易告吹时,钟摆又荡向另一个极端,新的
论调出现了:购并的失败将延迟信息高速公路建设的工期。数字化时代骤然之间又显得遥遥
无期了。电信公司的股票价格下跌了30%,其他相关的公司也遭池鱼之殃。庆祝的香摈只
好再倒回酒瓶之中。
但我的观点是,这并不是多么严重的灾难。事实上,贝尔大西洋公司和电信公司的协议
是最没有意思的企业购并案之一。这有点像销售不同尺寸水管的两个供应商决定要合并产品
目录一样。这场购并根本与深层次的传播频道与内容的结合无关。频道与内容的结合,意味
着比特生产和比特传输连成一体。1994年,迪斯尼公司和好莱坞之王迈克尔.奥维兹各自与
3家地区性电话公司结盟,这才是更有趣的事情。
消费电子业一直试图与娱乐公司结盟。原则上说,这是个强有力的想法,但到现在为
止,却未见多少协调成功的例子,原因在于各种各样的文化差异。当索尼公司斥资购买CBS
唱片公司(CBSRecords)和当时的哥伦比亚影片公司时,美国一片哗然。就像洛克菲勒中心
(RockefellerCenter)易主一样,日本人的一掷于金,引发了一场关于国家文化遗产是否
不仅在象征意义上、而且在实际形式上也已为外国所控制的争论。当松下公司在不久之后买
下MCA公司时,美国人更加震惊,因为MCA公司的董事长刘.瓦瑟曼(LewWasserman)在许
多人心目当中,是最能代表美国作风的企业领袖。我还记得,当我在第一次石油危机后造访
MCA公司总部时,看到电梯按钮上贴了一张纸,上面写着瓦瑟曼的话:“为了你的健康和你
的国家,请向上爬一层楼梯,或向下走两层楼梯。”这些购并案制造了巨大的文化鸿沟,这
道鸿沟不仅横亘于美国人和日本人之间,也横亘于工程师和艺术家之间。到目前为止,日本
人购买的公司都经营得并不成功,我怀疑将来也不可能成功。
文化融合
技术和人文科学、科学和艺术、右脑和左脑之间,都有着公认的明显差异,(不管这种
差异有多少是人为的)。刚刚萌芽的多媒体很可能像有些学科——比如建筑学——一样,在
这些领域之间架起桥梁。
电视的发明纯粹是由于技术上的推动。当费罗.法恩斯沃驴和弗拉基米尔.兹沃尔金等先
驱在1929年订得邮票般大小的电子影像时,他们纯粹是受了技术本身价值的驱使而想方设
法改进技术。虽然兹沃尔金早期对电视的使用有一些天真的想法,他在晚年却大失所望。
前麻省理工学院院长杰罗姆.魏思纳曾经讲过一个故事。魏思纳是肯尼迪总统的密友,
曾经担任过总统科学顾问。某一个星期六,兹沃尔金到白宫拜访他,他问兹沃尔金有没有见
过总统,兹沃尔金答没有。于是魏思纳带他穿过大厅去见总统。魏思纳向总统介绍来客时
说,这位就是“使您得以当选总统的那个人”。肯尼迪十分惊讶,问:“怎么说呢?”魏思
纳解释说:“这位就是发明电视的人。”肯尼迪表示,这真是一个伟大的成就。兹沃尔金椰
榆他道:“您最近看过电视吗?”
技术的需要——也只有这些需要——推动了电视的发展。然后,电视就被交到了一群无
论在价值观、还是在知识的亚文化背景方面,都与科学家遇异的创造性天才手中。
另一方面,摄影术是由摄影师所发明的。改进摄影技术的人出于艺术表达方面的目的,
而不断精研技术,以满足这门艺术的要求。这就好像作家创造了浪漫小说、散文和漫画等不
同形式,以表现不同的构想一样。
个人电脑已经使电脑科学离开纯粹的技术需求,走上与摄影术相同的发展道路。计算已
不再是军队、政府和大企业的专利。它正在直接转入社会各阶层的极具创造力的个人手中,
通过使用和发展,成为他们创造性表达的工具。多媒体的手段和讯息将会集科技和艺术成就
于一身,其背后的推动力将是人们对消费性产品的需求。
今天最快的英特尔处理器,其运行速度是每秒钟执行1亿条指令。将其与索尼公司的产
品比较一下,索尼刚刚推出价格200美元的新电子游戏“游戏站”,速度竞达到
1000MIPS。这是怎么回事呢?答案很简单:我们对新型娱乐的渴求似乎永无止境,而电子游
戏业所依赖的新型实时三维游戏,正迫切需要这种高速的处理技术和新的显示器。应用成为
驱动力量。拉力与推力
像维康、新闻公司(NewsCorporation)和本书的出版商这样的媒体巨孽都依靠掌握发
送网络,来提高信息和娱乐内容的附加价值。正如我前面所说,原子的传输要比比特复杂许
多,因此需要仰赖大公司的力量。相反,移动比特则十分简单,原则上不再需要大公司。几
乎可以这样断定。
通过阅读《纽约时报》,我结识了该报专写电脑和通信业方面报道的记者约翰.马可
夫,并十分欣赏他的文章。在过去,假如没有《纽约时报》,我可能永远看不到他的文章。
但是,现在就不同了。我可以轻而易举地利用电脑网络,自动收集他所有的最新报道,把它
丢进我的个人化报纸中,或是放在“建议阅读”资料档案中。我也许愿意因此付给马可夫每
篇文章“两分钱”(twocetlts)。
如果1995年互联网络全部上网人口中,有0.5%的人愿意像这样订阅马可夫的文章,
而马可夫每年创作100篇文章(事实上,他每年的写作量大约在120一140篇之间),那么
他一年就可以稳赚100万美元,我敢说那一定比《纽约时报》付给他的薪水要高。假如你认
为0.5%的比例太高了,先耐着性子等一下。这个数字会是真的。一旦有人打下了这片江
山,发送者在数字化世界里的附加值就会每况愈下。
比特的发送和运动必然也包含了过滤和筛选的过程。媒体公司除了于别的,还扮演星探
的角色,而它的发送渠道则成为舆论的试验场。但到了一定程度,作者也许不再需要这个论
坛。在数字化时代中,迈克尔.克莱顿直接在电子网络上卖书,一定会比经过出版商赚得更
多。克诺夫出版社,抱歉了!
数字化会改变大众传播媒介的本质,“推”(pushing)送比特给人们的过程将一变而
为允许大家(或他们的电脑)“拉”(pulling)出想要的比特的过程。这是一个剧烈的变
化,因为我们对媒体的整个概念是,通过层层的过滤之后,把信息和娱乐简化为一套套:
“要闻”或“畅销书”,再抛给不同的“受众”。当媒体公司如同杂志一样,越来越朝“窄
播”的方向迈进时,它们也在把比特推销给一些特殊兴趣团体,如汽车玩家、阿尔卑斯山滑
雪迷或葡萄酒涌君子等等。我最近想到一个点子,就是专为失眠者办一个杂志,而且聪明地
利用深夜电视节目的时段作广告,那时候广告价格还特别便宜呢。
信息业会变得更像服饰业。全球的信息公路都是它广大的市场,顾客则是大众和他们的
电脑代理人。这个数字市场真的存在吗?答案是肯定的,但这个市场只有当我们改进了人和
电脑之间的界面,使得人与电脑的对话就像人与人之间的谈话一样容易时,才会真正出现。
1、创造完美的人性世界为什么“数字化生存”如此辛苦?
多年来,我每天至少在电脑面前度过3个小时,但有的时候,我仍然发现自己饱受折
磨。搞懂电脑就和搞懂银行结算单差不多同样困难。为什么电脑(以及银行结算单)非得毫
无必要地弄得这么复杂呢?为什么“数字化生存”竟是如此辛苦呢?
其实,电脑并不复杂,数字化生存也不需如此辛苦。计算的发展速度飞快,但直到最
近,我们才获得了足够的成本低廉的计算能力,可以随心所欲地将其用来改进入与电脑的双
向交流。过去,把时间和金钱花在用户界面上,会被认为是愚蠢而浪费的行径,因为电脑的
运行周期太宝贵了,应该把它全花在解决问题上,而不是花在人的身上。
科学家会从许多方面论证简单生硬的界面的合理性。例如,在70年代初,好几篇“学
术”论文问世,论述黑白显示器为什么“优于”彩色显示器。彩色没什么不好。整个研究圈
子不过一心想为他们无力以合理的成本制造出好的界面而辩护罢了;或者,说得更难听一
点,他们根本不具备这样的想象力。
从60年代未一直到70年代,我们这群致力于研究人机界面的人,被视为缺乏男子气
概,受到公然的蔑视。尽管后来这一领域逐渐得到认可,但是我们的工作仍然被视为旁门左
道。
只要回想一下你上一次按了电梯按钮之后灯却不亮的情景,你就能体会到感知、生效和
反馈有多么重要了。电梯不亮的原因也许是灯泡烧坏了。但你心里一定万分沮丧,开始怀
疑:电梯听到我的指示了吗?由此可见,界面的设计和功能是非常重要的。
1972年的时候,全球总共只有15万台电脑。然而从现在起直到2000年,单单英特尔
一家集成电路生产商,就预期可以每年售出1亿枚芯片(而我认为他们还大大低估了市场的
潜力)。30年前,使用电脑就好像驾驶登月艇一样,懂得机器操纵魔法的人寥寥无几。那
时的电脑语言极为粗糙,甚至根本没有什么语言可用(只有许多拨动开关和一闪一闪的灯
泡)。我的看法是,科学家曾经下意识地想保持电脑的神秘性,就好像中世纪黑暗时期的僧
侣,刻意维护自己独尊的地位,或像当时的某些人,要独自把持古怪的宗教仪式一样。
今天,我们还在为此付出代价。致命的反应
当人们谈到电脑的样子和它给人的感觉时,其实他们指的是“图形用户界面”,也就是
“行家”所说的GUI。1971年左右,施乐公司开始研究GUI,后来又有麻省理工学院和其他
几个地方介入,这种界面获得了长足的进步。10年后,史蒂夫.乔布斯凭着他的智慧和毅
力,推出了麦金托什机,使GUI得以在一种真正的产品中出现,有关它的研究才达到了高
潮。麦金托什机使整个电脑市场向前跨越了一大步,相形之下,后来市场上几乎没有发生过
什么激动人心的事情。其他电脑公司花了整整5年时光,来模仿苹果电脑的技术。然而即使
到了今天,在某些方面,它们的成果依旧比苹果电脑逊色。
在努力使机器更能为人所用的过程中,人类几乎把全部心力都投入到改进人与机器接触
时机器对人的感应和作出更好的物理设计上。界面在很大程度上被当作一个传统的工业设计
问题。就好像设计茶壶和耙子的人,要考虑把手的形状、传热程度,并防止表面出现疤痕一
样。
设计驾驶舱是一大挑战,不只是因为驾驶舱中有众多的开关、按钮、转盘、仪表,还因
为两三种类似的传感输入装置可能会相互干扰。1972年,一架东方航空公司的L1011型客
机失事坠毁,原因是飞机起落架没有放下来。空中交通管制员的声音和机上电脑的哗哗声掩
盖了警告讯号声,使机组人员没能听到。这真是致命的界面设计。
我家里从前有一台非常聪明的录像机,能够近乎完美地辨认出我的声音,而且很清楚我
的喜好。只要我说出节目名称,它就会帮我录像存档。有时候,甚至不劳我开口,它可能就
会自动帮我录好。但是,突然有一天,我儿子上大学去了。
最近6年多来,我不曾再录过一个电视节目。不是因为我不会录,而是因为就耗费的力
气而言,录像的价值太低了。录像过程毫无必要地困难。更重要的是,大家一直把录像机和
遥控器的使用,看成按钮问题。同样地,一般个人电脑的界面,也被当成是物理设计的问
题。但是界面不仅和电脑的外表或给人的感觉有关,它还关系到个性的创造、智能化的设
计,以及如何使机器能够识别人类的表达方式。
一只狗在百码之外就可以通过你的步态认出你来,然而电脑却甚至连你就在那儿都不知
道。你生气的时候,几乎任何一只宠物都会察觉气氛不对,但是电脑却一片茫然。甚至连小
狗都知道自己做了错事,而电脑还是懵懂无知。
下一个10年的挑战将远远不止是为人们提供更大的屏幕、更好的音质和更易使用的图
形输入装置;这一挑战将是,让电脑认识你,懂得你的需求、了解你的言词、表情和肢体语
言。当你说“Kissinger”(基辛格)和“kissingher”(吻她)时,电脑应该能分辨个中
差异。但这并不是因为它能找出声音信号上的微小差别,而是因为它懂得你的意思。这才是
好的界面设计。
今天,人机交互的负担全部落在人的肩上,就连打印一个文件这样家常便饭的事情,都
可以把人搞得疲惫不堪,简直就是装神弄鬼的巫术,而不像体面的人类行为。结果,许多成
年人掉头他去,自认为是不可救药的电脑盲。
这一切都将改变。
漫长的旅程
1968年,阿瑟.克拉克和斯但利.库布瑞克(SianleyKubrick)因电影《2001年:太空
漫游记》同获奥斯卡奖提名。奇特的是,他们在拍完电影之后才出书,克拉克得以在看过初
剪的毛片后,修改他的小说手稿。(电影是根据更早的一个故事版本拍摄出来的。)影片使
克拉克可以根据电影场景模拟书中的情节,并锤炼原先的构想。在这本书付辛之前,他已经
实际看到和听到了他的构想。
或许这就是为什么他笔下的主角——一台名叫HAL的电脑,能如此出色地描绘出未来的
人机界面的原因(HAL同时也是致命的)。需要说明的是,HAL的名字与IBM无关(有人推
测出比H、A、L恰好分别是IBM前面一位的字母)。HAL的语言能力绝佳(能听懂别人的
话,也能清晰地表达),见解超凡,而且十分幽默,这表明它的智商很高。
几乎又过了1/4世纪,才出现了另一个完美的界面典范——知识导航员。苹果电脑当
时的首席执行官约翰.斯卡利(JohnScul1ey)委托制作了这盘录像带,它也具有电影般的效
果,被称作原型录像。斯卡利写了一本书,名字也叫做《漫游记》,书的结尾提到了“知识
导航员”的构想,后来就变成这盘录像带的内容。他希望通过录像带,描绘出未来超越鼠标
(mouse)和菜单(menu)的界面。他做了一件非常出色的工作。
在《知识导航员》录像带中,可以看到一位不修边幅的教授,他的书桌上放着一个平平
的书籍模样的装置,处于打开状态。在这个装置的显示器的一角,出现了一个打着领结的
人,也就是这部机器的化身。教授请这位机器代理人帮他准备演讲稿,还分配了几件工作给
它,这位代理人偶尔也会插进来提醒教授其他的事情。它能看、会听,还对答如流,和一般
的助手没什么两样。
HAL和知识导航员的共同之处是,它们都表现出超凡的聪明才智,以至于物理界面本身
几乎消失不见了。这就是界面设计的秘诀:让人们根本感觉不到物理界面的存在。当你第一
次和某人晤面时,可能会非常注意他的相貌、谈吐和仪态,但是很快地,你的注意力就会转
移到谈话内容上,尽管这一内容仍然主要通过说话的音调和面部表情来表达。
好的电脑界面也应该有同样的表现。界面应该设计得像人一样,而不是像仪表板一样。
另一方面,大多数界面设计人员一直在顽固地试图使笨机器更容易为聪明人所用。他们
在美国人所谓的“人性因素”(humanfactors)或欧洲人口中的“工效学”(ergonomics)
的领域各领风骚,研究人体如何运用感觉和反应器官来配合身边环境中的工具。
电话听筒或许是世界上设计得最多也最滥的一种设备了,但仍然十分不如人意。移动电
话的差劲界面令录像机都相形见拙。一部班和欧路森电话机根本不像电话,而像雕刻品,比
旧式的黑色转盘电话还难用。
更糟的是,电话的“功能”往往多得离谱。电话号码存储、重拨功能、信用卡管理、电
话等候、电话转接、自动应答、电话号码过滤等各种功能,全部挤进了只有已掌大小的话筒
中,让我们简直没有办法使用。
我不但不想要所有这些花哨的功能,我甚至根本不想拨电话。为什么设计电话的人全都
不明白,没有人爱拨电话,我们只想利用电话来和别人取得联系!
像拨电话这样的事情,只要有一点点机会,我们都愿意别人代劳。这使我想到,电话的
问题也许不在于听筒设计,而在于我门能否设计出可以塞进口袋里的机械秘书。与电脑共生
电脑界面设计始于1960年3月,当时杰西.里克莱德发表了他的论文《人与电脑共生》
(Man一Comp-uterSymbiosis)。大家都亲切地称里克莱德为里克,他是位实验心理学家和
声学家,在这两方面受过良好的训练,后来成为电脑计算的信徒和救星,主持了美国高级研
究计划署早期的电脑研究。60年代中期,他应邀为卡内基委员会、
(CarnegieCommission)一份关于未来电视的报告撰写附录。正是在这份附录中,里克提出
了“窄播”的说法。然而,里克当时没有料想到的是,他的两大贡献,“人与电脑共生”和
“窄播”注定要在90年代相互融合。60年代初期肇始的人机界面研究分成两部分,这两部
分在其后的20年中各自独立发展,始终未能相互融合。一部分研究的是互动性问题,另一
部分则把重心放在感应的丰富性方面。互动性的研究偏重于解决电脑共用的问题,因为在当
时,电脑是一种极其昂贵而且大一统的资源。在50年代和60年代的早期,由于电脑太宝贵
了,你会想尽一切办法让它不停地运转。把一部电脑接上键盘,用电脑打出一个问题,接
着。再让它闲置在那里,等待人们阅读问题、思考,然后回答,这简直是无法想象的。分时
的发明使这样做成为可能。所谓分时,就是让多个用户能够在彼此相隔很远的地方,共同使
用一台电脑。假如你把电脑资源在10个人当中分配,那么,不但每个人可以分享1/10的
机器使用时间,而且,当一个人在思考的时候,或许电脑可以完全为另外一个人所用。这种
分食数字化大饼的做法要想行得通的条件是:没有一个用户的胃口过大,需要进行大量的计
算或需要大量带宽。早期终端机的速率是110波特;我还记得清清楚楚,当速率提高到300
波特时,感觉真是快极了。同床异梦相反地,有关感应丰富性的研究则偏重于极高带宽的图
形互动上。早期的电脑制图需要一部机器专门用来提供图像。基本上,它与今天的个人电脑
并无二致,但是却大得多,能够装满一间屋子,并且要耗费数百万美元。电脑制图技术刚诞
生时,是一种勾画线条的媒介,需要强大的计算能力来直接控制阴极射线管的电波。一直到
了10年之后,电脑制图才从单纯的勾画线条,发展到可以制作多种形状和图像。出现了一
种叫做“光栅扫描显示器”(rasterscandisplay)的新型显示器,它需要大量的记忆容
量,以一点一点地存储画面,它们今天已经随处可见,然而,大多数人都不知道这种显示器
当初曾经被视为异端。事实上,在1970年,几乎没有人相信电脑存储器有那么一天会便宜
得可以被大量用在制图上。在此之后的20年中,分时技术和电脑制图可以说是同床异梦。
感应能力贫乏的分时系统成为商业和学术界广为接受的计算工具,促成了我们今天习以为常
的电子银行和民航订位系统的诞生。商用分时系统的界面设计通常十分简陋,输出形式和打
字机几乎没有什么两样;而且对任何单一用户而言,整个系统似乎刻意放慢速度,以便其他
人也能够得到他们应有的那一份电脑资源。另一方面,电脑制图大多应用在独立计算上。到
1968年,价格在20000美元左右的小型机开始出现,主要原因是当时的工厂和机器自动化
(automation)进程都需要非常精确而且实时的控制系统。电脑制图也是一样。这种独立的
电脑制图系统与显示装置一起,构成了今天我们所了解的“工作站”(worksta-tion)的
前身,其实工作站只不过是穿上了长裤的个人电脑罢了。多模式界面
我们通常都是把累赘当成一种坏现象,暗指无谓的冗长以及漫不经心的重复。在早期的
界面设计中,人们研究互动技术,并且尝试为不同的环境明智地挑选出不同的界面运作方
式。光笔(lightpen)会不会比数据板更好呢?这种“二者必居其一”的思维方式,是受到
了一种错误信念的支配,即以为任何一种特定的情况都会有一个放之四海而皆准的“最好解
决方案”。之所以说这种信念是错误的,是因为人是互不相同的,情况也是瞬息万变的。此
外,某种特走的互动方式究竟适合哪种环境,很可能要视你当时可用的信道而定。大底下没
有一种最佳的界面设计。
我还记得,70年代中期,我去拜访一位海军上将,当时他有一套最先进的指挥控制系
统。他先向一位下级水兵发号施令,然后再由其十分尽责地把命令输入电脑。因而,在一定
的意义上,整个系统有了一个绝佳界面,这个界面不仅能识别语言,而且还很有耐性。海军
上将可以随心所欲地在房间里走来走去,一边谈话,一边指手划脚。他完全就是他自己。
尽管如此,海军上将从没想过通过这样的间接界面来策划一场进攻。他很清楚水兵可以
从电脑系统的小小显示器上,一窥整体形势,但是他宁可和墙壁上一张很大的战区地图直接
互动,因为这样一来,他就可以把小小的形状各异的蓝色和红色军舰标志,钉在这张地图
上。(那时我们总是开玩笑说,苏联人也用同样的颜色。)
海军上将乐于使用这张地图,不只是因为地图是传统的作战工具,有清晰的画面,而且
还因为他可以把自己完全投入其中。当他移动地图上的军舰的时候,他的手势和动作都加强
了他的记忆。他完全陷入到战局的演示之中,连脖子上的肌肉都绷紧了。这种界面不是“非
此即彼”(either/or),而是“二者兼顾”(both/and)。“二者兼顾”的思维带来了
一大突破,简单他说来,就是“累赘是好的”。事实上,最好的界面应该是有许多不同而并
存的交流渠道,通过这些渠道,一个用户可以利用一组不同的感应装置(可能是用户的,也
可能是机器的)进行表达并撷取意义。同样重要的是,一种交流渠道也许能够弥补其他渠道
传递信息之不足。
例如,假如一间屋子有十来个人,我问其中一个人,“你的名字叫什么?”除非在我问
话的时候,你能够看见我的目光所及之处,否则这个问题根本没有任何意义。也就是说,形
容词“你的”,其意义来源于我的眼睛注视的方向。
这种状况在麻省理工学院的狄克.波尔特(DickBoLL)和克里斯.施曼特
(ChrisSchmandi)所开发的名为“把它放在那儿”的程序中,得到了完美的印证。1980年
推出的该程序第一版,能够让你对着墙壁大小的显示器说话和作手势,以及在一个空白的屏
幕上(后来改成加勒比海),移动简单的物体(后来化为船只)。在“把它放在那儿”程序
的示范影片中,这个程序误解了一条指令,施曼特脱口而出:“哎呀,该死”这句话在影片
中给观众留下了很深的印象,提醒许多未来的观众,有待努力的地方还有很多。
整个构想其实再简单不过:说话、指点和眼神,应该作为一个多模式界面
(multimodalinterface)的不同部分共同工作。这种多模式界面,不再仅仅是来来回回地
传递讯息(这是分时的基础),而是更像人与人之间面对面的谈话。
当时,这种试图以“二者兼顾”的方式来设计界面的研究,和其他类似的早期研究一
样,看起来像门有水分的科学。我就不怎么看得起界面研究中的测试和评估工作。或许我大
自大了,不过我认为假如你必须在小心翼翼地测试某个设计后,才能看出它所造成的差异,
那么,这个设计首先根本就没有造成足够大的差异。
成长的秘密
当我还是个小男孩时,我的母亲有个家用壁橱,壁橱后面有二堵“秘墙”。这个秘密其
实没什么大不了的:墙面上有许多小心刻划的铅笔痕迹,代表我定期测量的身高。所有的铅
笔线旁边都尽责地标注了日期,有些线靠得很近,因为那段时间身高测得比较频繁;有些线
隔得很远,很可能因为那年夏天,我们外出度假了。再弄一个壁橱建一堵秘墙,似乎不可
行。
这个身高测量法是我个人的私事,我猜它某种程度上也反映了我喝了多少牛奶、吃了多
少菠菜和摄取了多少其他好东西。
相较之下,“成长”具有更加戏剧化的一面。一位许久未见面的叔叔看到我时,也许会
问:“你成长得怎么样啦,尼基?”(假定他已有整整两年没见到我了。)但是,我没有办
法真正体会到自己的改变。我能看到的只是壁橱秘墙上那些短短的铅笔线。
这种“刚刚能够看出来的差异”或简称JND,是心理物理学的一种测量单位。单单这个
名称本身,就已经影响了界面的设计。你不得不自问,假如不过只有“刚刚能够看出来的差
异”,何必这么费事呢?假如你只有小心测量,才能找出其中的差异所在,也许我们的努力
方向就是错误的:应该往能够产生较大差异的方向努力。
举例来说,学术研究显示,在大多数应用上,讲话和自然语言都不是人与电脑之间的合
适的沟通渠道。这些技术研究报告中充斥着各种表格及对照实验等,只为了证明自然语言容
易给人机沟通造成混乱。
我当然不会期望一架波音747客机的驾驶员只要高唱:“高高高高飞——!”飞机就会
滑行和起飞。即便如此,我仍然想不通为什么我不能运用丰富的语言和手势来控制事物,哪
怕是在驾驶舱中。无论你把电脑应用在什么地方,都必须把丰富的感应能力和机器的智能两
者的力量结合起来,才能产生最有效的界面设计。
如此一来,我们将可以看到显而易见的差异。我们将看到的是我叔叔眼中的我,而下是
带橱L短短的铅笔痕迹。我的梦想
我对界面的梦想是,电脑将变得更像人。这种想法很容易招致批评,人们会嫌它太浪
漫、太含混或太不切合实际了。真要批评的话,我会说这个想法还太保守了。可能有许多异
乎寻常的交流渠道甚至到了今天,我们都还浑然不觉。(由于我妻子是双胞胎姊妹中的一
个,而我自己也有对双胞胎弟弟,从自己的实际观察中,我完全相信超感觉的交流方式不是
不可能存在的。)
60年代中期,我给自己设立的目标是,模拟面对面的交流方式,其中包括了手势,面
部表情以及肢体动作。我把海军上将作为我的模型。
在具有里程碑意义的“空间数据管理系统”的研究计划中(时间大约在1976年左
右),我们的目标是提供一个“让将军、企业总裁和6岁儿童都能使用电脑”的人性化界
面。我们把系统设计得能让用户在30秒种之内学会操作。由于所有人都对桌面和书架非常
熟悉,这两种东西被借用来作为例览和操纵复杂的声音、影像和数据资料的工具。
在70年代末期,这样做已经算是很激进了。但按照海军上将与水兵之间的对话方式来
安排人机交流,此种做法能够产生的意义和影响,仍然是“空间数据管理系统”未能洞察
的。未来的人机界面将根源于“授权”,而不是直接控制——下拉菜单弹出,按鼠标等等—
—同时,也不再是鼠标界面。我们一直执著于让机器达到“容易操作”的境界,有时候却忘
记了许多人压根儿就不想操作机器。他们只想让机器帮他们做事。
未来,今天我们所谓的“代理人界面”将崛起成为电脑和人类互相交谈的主要方式。在
空间和时间的某些特定位置上,比特会转换为原子,而原子也会转换为比特。无论这种转换
是通过液晶传输还是语音发生器实现的,界面都将需要不同的尺寸、形状、颜色和语调,以
及其他五花八门的能够感应的东西。
2、图形幻界电脑制图“大爆炸”
1963年,伊凡.苏泽兰(IvanSutherland)在麻省理工学院发表了名为《画板》的博士
论文,其互动式电脑制图的构想犹如给全世界投下了“一枚炸弹”。画板是一个实时的素描
系统,使用者可以利用“光笔”,直接和电脑屏幕进行互动式交流。这个成就太伟大了,意
义也极为深远,我们中的一些人,直到10年后才开始领会它的全部价值所在。画板为我们
带来了许多新概念,随便举几个例子,就可以说出动态图形、视觉模拟、有限分辨率、光笔
追踪以及无限可用协调系统等等。画板可以说是电脑制图的“创世大爆炸”。
接下来的10年里,许多研究人员似乎对电脑制图的实时和互动层面失去了兴趣。相
反,大多数人把创造力投入到脱机的,非实时的真实影像合成技术上。苏泽兰自己也稍稍偏
离了原本的方向,转而研究图像逼真度,也就是要寻找能够让电脑像变得栩栩如生、刻划入
微的方法。这种研究的重心完全放在阴影、明暗、反射、折射、隐蔽的物体表面等等诸如此
类的问题上。绘制精美的国际象棋棋于和茶壶成了后画板时代的象征。
就在同一段时间里,我越来越觉得,人类如何能够简单而轻松地表述他们的图形构想,
这是一个比机器能否合成如照片般逼真的影像重要得多的问题。在好的人机界面设计中,电
脑应该能够理解不完整的,模糊不清的想法——这类想法常常会在任何一个设计的初始阶段
出现——而不是只懂得那些以比较完整和连贯的方式表达的复杂化的,己成形的东西。在电
脑上实时追踪手绘草图,为我提供了一个绝佳的领域,我得以在这一领域开展研究,把电脑
制图作为一种动态更强的、互动性更好的而且表达能力更佳的媒介来加以理解,并推动这种
媒介的发展。
我的一个至关重要的工作思想是,你必须了解一个人的绘图“意识”。如果一位用户慢
慢地画了一条轻轻的、但似乎是有意画出的曲线,电脑会假定他或她就是要画这样一条曲
线,但是假如用户很快画了一条一模一样的曲线,很可能他或她原本打算画的是一条直线,
却不小心画歪了。假如我们只根据这两条曲线完成后的实际形状、而不是用户描绘线条时的
状况来判断,那么这两条曲线看起来完全一样。但是,用户的绘图动作却显示出两种截然不
同的意图。而且,由于每个人画画的风格都不相同,表现出来的绘图行为也会因人而异。因
此,电脑必须学习掌握每个用户的绘图风格。
30年后,苹果公司的产品“牛顿”牌掌上型电脑(Newton)体现了同样的思想。它能
根据使用者的书写风格,辨认出他的笔迹(尽管效果还不如人意)。那些花了较长时间在牛
顿电脑上写字的人,似乎感觉更满意一些。
电脑辨认粗略绘出的形状及物体的潜力,使我对电脑制图技术的思考从线条而更多地转
向了“点”。在一张草图上,线条之间的区域或被线条围起来的部分是最重要的部分,从中
可以了解草图的意义。
就在这段时间里,施乐公司的帕洛阿尔托研究中心也发明了着重形状识别的电脑制图技
术。在这种技术中,图像作为庞大的点的集合而被存储和显示,不规则区域在此过程中得到
处理,变得规则起来。我们中的一些人当时得出结论,认为互动式电脑制图技术的未来将属
于与电视相似的光栅扫描显示器,而不是“画板”这类勾画线条的机器。光栅扫描系统能把
在电脑存储器中存储的影像描绘在一个显示装置上,而在过去,则是靠把阴极射线管的电波
水平和垂直地进行交叉扫描,如同用腐蚀法蚀刻一幅图画一样,电脑制图的基本元素过去一
直都是线条,现在变成了像素。像素威力大
就像比特是信息的原子一样,像素可视为图形的分子。(我没有把像素称为图形的原子
咽为通常一个像素由不止一个比特来代表J电脑制图人员发明了“像素”这个词,它是由
“图像”(picture)和“元素”(e1ement)两个词缩合而成的。
我们可以把一个图形想象成许多行和许多列像素的集合,就好像空白的填字游戏图一
样。对于任何一个特定的单色图像(monochromeimage),你都可以决定要用多少行和多少
列来构图。你用的行和列越多,每个方块的面积就越小,图形的颗粒就~越精细,效果也就
越好。想想看,假如你把这样的格子覆盖在一张照片上,然后给每一个方块依明暗度的不同
标出一个数值,那么完成了的填字游戏图将会布满一串串数字。
假如图形是彩色的,每个像素就会带有3个数字,通常这3个数字要么代表红色、绿色
和蓝色,要么代表亮度(intensity)、色调(hue)和色彩饱和度(saturation)。我们在
小学里都学过,红色、黄色和蓝色,并不是三原色。加色三原色,也就是我们在电视机里看
到的,是红色、绿色和蓝色;而减色三原色,也就是我们在彩色印刷品上看到的,是洋红
(magenta)、青色(cyan)和黄色。它们都不是红色、黄色和蓝色。
如果画面是运动的,我们就对时间进行取样——就好像在电影中分出一个个画面一样。
每个样本即为一幅画面,也就好比另外一个填字游戏图,如果将其罗列在一起,以足够快的
速度连续播放,就会产生运动流畅的视觉效果。你平日很少见到动态图形,或者只能在小小
的视窗上显示影像画面,原因之一就是很难快速地从存储器中取得足够数量的比特,然后以
像素的形式把它们显示在电脑屏幕上(只有每秒产生60——90幅画面,画面上的动作才会
流畅,不再闪动不己)。在这方面,每天都不断出现速度更快的新产品或新技术。
像素的真正威力来源于它的分子本质。像素可以成为任何东西的一部分,从文字到线条
到照片,无一不可。“像素就是像素”,道理就跟“比特就是比特”一样正确。只要有足够
的像素,每个像素又有足够的比特(不管是黑白的还是彩色的),你都可以在目前的个人电
脑和工作站上,获得非凡的显示效果。然而,这种基本的网格结构决定了,在具有很多优点
的同时,它也必然存在一些缺陷。
像素一般需要庞大的存储容量。你用的像素越多,每个像素内含的比特数目越多,你也
就需要越大的容量来存储它们。常见的全彩屏幕共有1000X1000个像素,需要容量为2400
万比特的存储器。1961年,当我还在麻省理工学院读大学一年级时,存储器的价格大约是
每个比特:美金。今天,2400万比特不过只值60美金,这意味着,尽管以像素为基础的电
脑制图技术对存储容量的胃口很大,我们却多少可以把心放下。
仅仅在5年以前,情况还不是这样,人们为了省钱,尽可能减少每个画面所用的像素和
每个像素需要的比特。事实上,在早期的光栅扫描显示器上,每个像素常常只占用一个比
特,由此给我们留下了一个特殊的问题:锯齿状的图形(jaggies)。无法接受的锯齿图
你是否曾经有过这样的困惑:为什么我的电脑屏幕上会出现一条条锯齿线?为什么金字
塔的图像看起来仿佛歪歪扭扭的宝塔?为什么大写的E、L和T在屏幕上挺像样,而S、W和
O则好像蹩脚的圣诞节饰物?为什么曲线看起来总像是中风病人画的一样?
个中缘由就在于,每个像素只用了1个比特来显示图像,结果就出现这种楼梯效应
(staircaseeffect)或称空间阶梯,只要硬件和软件生产商肯把更多的比特用在一个像素
上,并且运用一点数字计算来解决这个问题,这一现象就绝对可以避免。
那么,为什么我们不让所有的电脑显示器都带有“防锯齿”功能呢?借口是这样会消耗
大多的计算能力。10年前,我们或许还会接受这个论点,即电脑的计算能力最好是用在别
的地方;此外,当时用以防止锯齿现象的中间灰度技术还不像今天这么普遍。
不幸的是,消费者已经被训练得对锯齿图像习以为常了,我们甚至似乎已把这类图像变
成某种吉祥物了,就好像60和70年代的图形设计人员经常用滑稽的磁性活字体来创造出
“电子”的感觉一样。到了80年代和90年代,设计人员又如法炮制,以夸张的、阶梯状的
印刷体来表现“电脑化”。今天,无论是线条还是字符,都能达到完美丽流畅的印刷效果,
别让任何人告诉你说这一点无法做到。目标背后的神奇
1976年,美国高级研究计划署控制论技术中心软件部门的一位主任克瑞格.费尔兹(后
任高级研究计划署署长),委托纽约一家电脑动画公司制作了一部电影,描绘一个叫做达尔
玛拉的虚构沙漠小城的景象。这部动画片选择一架直升飞机的座舱作为观察点,这架直升机
在小城上空盘旋,时而俯冲掠过街道,时而拉起俯瞰全城,时而走访社区邻里,时而又贴近
观察建筑物。他们模仿的是《小飞侠》(PeterPan)这部电影,目的不是为了欣赏沙漠小城
的景色和建筑,而是为了探索信息世界。其想法是:假定你设计了这个小城,而且好像松鼠
储藏核桃一样,把数据储藏在特定的建筑物中,从而构筑了信息的邻里环境。随后、你可以
乘坐魔毯,飞到你储存数据的所在,检索你所需要的信息。
古希腊诗人凯奥斯岛的西摩尼得斯(SimonidesofCeos,公元前556一468年)以非凡
的记忆力闻名于世。有一次参加宴会的时候,他刚刚被叫出宴会厅,大厅的房顶就整个坍
塌,在这场横祸中惨死的宾客都肢体破碎、难以辨识,而西摩尼得斯却可以根据此前宾客所
坐的位置加以指认。他的故事表明,把需要记忆的材料与头脑中的空间形象的许多特定的点
联系起来,可以帮助我们回忆。西摩尼得斯使用这个技术以记忆长篇讲槁。他先把讲稿分成
几个部分,每一部分都与一个神殿里的物体及其位置结合起来;等到发表演讲的时候、他重
新造访脑海里的神殿,以井然有序和容易理解的方式,唤出他想表达的看法。早期到中国传
教的耶稣会教士称这种过程为建构“心灵的殿堂”。
这些例子都牵涉到在三维空间里漫游,存储和检索信息的过程。有些人对此很在行;有
些人则不然。
在二维空间里,我们大多数人都比较能干。想想你书架正面;的二维空间吧。要找任何
一本书,你可能只要径直走到那本书“面前”就可以了。你也许会记得它的大小、颜色、厚
度及装订方式。如果是你亲手把书放在“那儿”的,你当然会更清晰地忆起这一切。再杂乱
的桌面、使用桌子的人都能对之了如指掌,因为可以说:杂乱是由他一手造成的。最糟糕的
事情,莫过于叫来一位图书管理员,让他按杜威十进分类法(Deweydecima1system)重新把
书架上的书排列一遍,或找到一位女佣帮助你清理书桌。你会突然变得糊涂起来,不知道东
西都放在什么地方了。
基于这类观察,我们开发了一种叫做“空间数据管理系统”的东西。空间数据管理系统
包括了一个高及天花板、占据整面墙的全彩显示器,两台附属的桌面显示器;八度的音响;
一把装满各种仪器的埃姆斯椅(Eameschair)以及其他各种装备。它为用户提供了如沙发般
舒适的界面,用户可以在幻想中途巡于数据之中,从一个橱窗般大小的显示器向外凝视;也
可以自由地伸缩或摇动镜头,以在一个虚构的二维空间“数据乐园”里神游。用户还可以沏
览个人档案、通信、电子书、卫星图,以及各种崭新的数据形式,例如名演员彼得.福尔克
(PeierFalk)在《神探科伦坡》中的表演片断,或是54000幅有关艺术和建筑的静态图片
收藏。
“数据乐园”本身是由一组小图像构成的景观,每个小图像都表明了自己的功能或描绘
了所代表的数据内容。例如,在一个台历图像背后可以弹出用户的日程表。如果用户驱动系
统进入到一个电话图像中,空间数据管理系统就会开启一个电话程序并附上相关的私人电话
号码本。“图标”(icon)就是这样诞生的。我们曾经半真半假地打算使用“标记”——同
来描述这种小图像,因为icon在字典上的意思并不那么贴切,但icon一词还是流传下来。
这些邮票般大小的图像不光指明了信息内容或自身的功能,而且每个图像还拥有各自的
“位置”。这就好比在书架上找书一样,当你想检索某样东西时,你可以直接走向它所在的
地方,同时想起它的确切位置、颜色、大小,甚至它可能发出的声音。空间数据管理系统大
大领先于它产生的时代,直到10年后,个人电脑诞生,它的一些观念才成为现实。今天,
所有的电脑都离不开图标,人们把垃圾桶、计算器和电话筒等图像当作屏幕上的标准配件。
事实上,有些系统直接把屏幕称作“桌面”,唯一不同的是,今天的“数据乐园”不会顶及
大花板、占据整面墙,而是一股脑儿挤进了“视窗”之中。挤进视窗中
有一种现象总是给我留下深刻的印象:聪明的产品命名,能够帮助产品大发利市,并给
消费者带来完全不同的想象空间。当年IBM决定把它的个人电脑命名为pc真是神来之笔。
尽管苹果电脑比其早上市4年还多,pc的名称现在却已成为个人计算的同义语。同样地,
当微软决定将其第二代的操作系统取名为“视窗”的时候,这聪明的一招,使这个名词从此
永远归它所用;而实际上早在1年多前,苹果公司就开发出了更好的视窗,而且许多工作站
生产商也已经广泛地使用了视窗。
视窗所以存在,是由于电脑屏幕很小。使用视窗后,无论在任何时间,都可以利用一个
狭小的工作空间,同步进行不同的流程。《数字化生存》全书都是在一个对角线只有9英寸
长的屏幕上写成的,没用任何纸张,当然出版商在编辑和制作过程中所需的纸张除外。对大
多数人来说,使用视窗就好像骑自行车一样;你甚至都不记得自己学过骑车,你只是上来就
用。给电视开扇窗
视窗还有一个有趣之处:它暗示了未来电视的发展方向。在过去,美国比其他国家都更
加强调,电视影像应填满整个屏幕。但是,这要付出额外的成本,因为并非所有的电影和电
视片都被制作成相同的长方形格式。
事实上,50年代初期的时候,电影业曾经有意识地朝宽银幕方向发展。当时出现了
“全景电影系统”,“超级全视系统”,“超级全景技术系统”,35毫米“全视系统”,
以及我们今天仍在使用的“电影宽银幕系统”。这一发展是为了抑制早期电视的扩张。今天
电视荧幕3:4的高宽比,源自于第二次世界大战之前的电影银幕规格,并不能与“电影宽
银幕系统”相匹配,也就是说,过去40年来制作的大多数电影的格式都与电视不合。
欧洲的电视业者以所谓的“上下加框”的办法来解决荧幕高宽比的差异问题。他们把荧
幕的上下两边都用黑框盖住,因此留下来的放映区域正好符合电影银幕的高宽比。通过牺牲
一些像素,观众得以看到忠实地重现出原本的画面形状的影片。事实上,我认为“上下加
框”的效果十分令人满意,而且这样做还有一个额外的优点:它在影像上下各自放置了一道
鲜明的水平黑边,从而取代了电视机原本的弧形塑料边;否则的话,影像的界限就不会那么
明确。
我们在美国则很少这么做。当我们要把电影转换成录像带时,采用的是“摇摄及扫描”
(panandsca-n)的做法,把宽银幕电影压缩为3:4的长方形。我们不是真的把影像压扁
(尽管我们有时会压缩标题和工作人员名单字幕)。相反地,在转换过程中,当影片在机器
中转动时(机器通常是一台飞点扫描器),操作员会以手控方式,把一个高宽比为3:4的
窗口套在宽得多的电影画面上,借着上下左右调整移动该窗口,来捕捉每一幅电影画面中最
直接相关的内容。
而有那么一些电影制作人,不同意这种做法,例如伍迪.艾伦,但是大多数人似乎都无
所谓。这种“摇摄及扫描”的办法,在某些情况下会无可救药地失败,最好的例证之一就是
《毕业生》(TheGraduate)。影片中有一场戏是达斯汀.霍夫曼与安.班克罗夫特各据银幕
的一端,分别宽衣解带,操作员根本无法把他们俩同时放在录像带的同一幅画面中。
日本和欧洲一直都在推动发展一种更新、更宽的电视荧幕,这种荧幕的高宽比为9:
16,而美国的高清晰度电视竞争厂商也胆小地尾随其后。然而,9:16的高宽比实际上也许
比3:4还要糟,因为所有现存的录像材料(其高宽比为3:4)在放映的时候,都会在9:
16的荧幕左右两旁造成垂直的黑边,也就是所谓的幕布。幕布不仅比“上下加框”更难以
达到视觉效果,而且,即使你想用“摇摄及扫描”的方法来补救,都做不到。
我们应当把高宽比作为一个变数。当电视有了足够的像素时,采取视窗方式具有非比寻
常的意义。10英尺银幕与18英寸荧幕的收视经验开始合而为一。事实上,将来,当你拥有
极高的显像分辨率和上及天花板、占满整面墙的超大显示器时,与小屏幕上的画面不同,你
也许会把你的电视影像放在大屏幕上,就好像房间里的植物一样,成为室内装饰的一部分。
整面墙都可以成为电视画面。
3、虚拟现实矛盾修饰与重复修饰
麦克.哈默(是全球首屈一指的企业名医或者所谓的“企业形象再造工程师”)将“企
业变革”形容为一种几乎要变为重复修饰的矛盾修饰(基础稳固的大企业却需要变革!)。
所谓“重复修饰”,是指像在“某人自己的心目中”这类重复累赘的表述;而矛盾修饰,则
是像“人工智能”或“飞机食品”等显而易见的矛盾组合。重复修饰和矛盾修饰是否恰好相
反,还有争论的余地,但倘若我们要颁发“最佳矛盾修饰奖”,那么“虚拟现实”一词一定
榜上有名。
假如我们把组成“虚拟现实”一词的“虚拟”和“现实”两个部分看成“相等的两
半”,那么把“虚拟现实”当成一个重复修饰的概念似乎更有道理。虚拟现实能使人造事物
像真实事物一样逼真,甚至比真实事物还要逼真。
比如说,飞行模拟,这一最复杂和使用时间最久的虚拟现实应用,就比驾驶一架真正的
飞机还要逼真。刚训练出来的、但已练就一身好本领的飞行员之所以能在初试牛刀时就驾驶
一架满载乘客的“真正”波音747客机,原因就是他们在飞行模拟器上学习驾驶技术,要比
他们在真正的飞机上学到的还要快、还要多。在模拟器中,飞行员会置身于在现实世界里可
能不会出现的所有罕见的情况中,包括飞机几乎相撞或裂成几段。
另外一个具有社会意义的虚拟现实应用,就是汽车驾驶学校的驾驶训练。在一条湿滑的
路上,突然有个小孩冲到两辆汽车中间,如果从未经历过这种情况,谁也不知道自己会作何
反应。虚拟现实容许我们“亲身”体验各种可能发生的情况。身临其境
虚拟现实背后的构想是,通过让眼睛接收到在真实情境中才能接收到的信息,使人产生
“身临其境”的感觉,更重要的一点是,你所看到的形象会随着你视点的变化即时改变,这
就更增强了现场的动感。我们对真实空间的感觉来自于各种视觉线索,例如物体的相对体
积、亮度以及在不同角度上的运动情况。其中最强烈的线索来自于双眼透视,由于左右眼看
到的形象并不相同,双眼同时使用时就会产生特别强有力的效果。把这些不同的形象合成一
个三维图像,也就构成了立体视觉的基础。
每只眼睛的深度知觉略微不同,造成了两只眼睛所看到的形象不尽相同。这种现象称为
视差。当近距离观察物体时(假如在6英尺以内),视差的效果最为显著。距离较远的物体
基本上会在两眼上投射相同的影像。你有没有想过为什么立体电影里总是有许多近距离内来
来回回的动作?为什么影片里的物体总是朝观众席里飞来?因为那些移动正是设计在立体影
像的最佳效果距离之内。
虚拟现实的典型道具是一个头盔,上面有两个护目镜般的显示器,每只眼睛对应一个显
示器。每个显示器都显现稍微不同的透视影像,与身临其境时的情景完全一样。当你转动脑
袋的时候,影像会以极快的速度更新,让你感觉仿佛影像的变换是因你转头的动作而来(而
不是电脑实际上在追踪你的动作,后者才是实情)。你以为自己是引起变化的原因,而不是
经由电脑处理后所造成的一种效果。
视觉经验的真实程度是由两个因素共同决定的。其一是图像的质量,即图像中显示的边
和其间结构的数量的多少,数量越多,质量越好。其二是响应时间,即画面更新的速度,速
度越快越好,响应时间越短越好。这两个变数都要求电脑具有十分强劲的威力。直到最近,
对大多数的产品开发商而言,这样威力强大的电脑还不可得,现在情况刚刚有了改变。
虚拟现实技术早在1968年就已诞生,当时第一个头戴式的显示系统正是由伊凡.苏泽兰
制造成功的。后来,美国国家航空和宇宙航行局以及国防部所作的研究,为太空探索和军事
应用开发了一些价格昂贵的虚拟现实原型机。虚拟现实特别适合用在坦克和潜水艇操作训练
上,因为在“真实的”战争中,同样必须透过望远镜或潜望镜来观察外面的景象。
直到今天,当我们拥有了威力强、成本低的电脑时,才可能把虚拟现实技术当作一种满
足消费者娱乐目的的媒介。而在虚拟现实的新面貌中,绝对少不了令人惊恐万状的镜头。侏
罗纪公园探险
“侏罗纪公园”可以让你体验到虚拟现实的惊人效果。但是和同名电影或书不同的是,
在虚拟现实的侏罗纪公园里,并没有一条故事的主线。在这里,迈克尔.克莱顿的任务就像
舞台设计师或游乐场设计师一样,是赋予每只恐龙不同的外貌、个性、行动和目的。模拟的
恐龙动起来之后,你走入它们中间。这不是电视,也不必跟一尘不染的迪斯尼乐园一样。这
里没有拥挤的人群,没有长长的队伍,也没有爆米花的香味,有的只是恐龙的粪便。你就好
像走入了史前的丛林中,而且这里可以显得比任何真正的丛林都更加危险。
未来的大人和孩子都可以用这种方式自娱。由于这些幻象全部经由电脑处理而产生,并
非真实的情境,因此也就无需受实物大小或发生地点的限制。在虚拟现实中你可以张开双
臂,拥抱银河,在人类的血液中游泳,或造访仙境中的爱丽丝。
目前的虚拟现实还有不少缺点和技术上的失误,必须加以克服之后,才能使它具有更广
泛的吸引力。例如,低成本的虚拟现实就深受阶梯状不规则图形的困扰。当影像移动的时
候,这种锯齿状的图形显得更不稳定,因为它们看起来好像在移动,但却不一定与画面移动
的方向一致。想一想水平线的样子,一条非常平直的水平线。现在稍稍把它倾斜一点,水平
线中央就会出现一段锯齿形状,然后再倾斜一点,又出现第二个、第三个和更多的锯齿地
带。这些锯齿看起来仿佛在移动,直到这条线终于倾斜成45度角,则线上相邻像素所组成
的锯齿排成了一个楼梯形,一个挨着一个,简直难看极了。总是慢半拍
比这还要糟的是,虚拟现实的速度还不够快。所有的商业系统,尤其是许多电子游戏生
产商即将推出的新产品,都有慢半拍的问题。当你转动头部的时候,影像会很快地改变,但
是还不够快。图像总要慢半拍才出现。
三维电脑图形刚出现的时候,人们使用各式各样的立体眼镜来达到观看效果,有时是廉
价的偏光镜片,有时则是较昂贵的电子快门,会轮流让双眼接收不同的影像。我还记得,我
第一次操作这类装置时,所有的人——不是大多数人,而确确实实是每个人——生平第一次
戴上这种眼镜、并在屏幕上看到立体图像后,都会把头转来转去,想看看图像怎么变。结果
就和看立体电影一样,图像并没有改变。把头转来转去没什么用。
人们这种“扭动脖子”的自然反应正说明了一切。虚拟现实必须紧密配合对用户的动作
和所在位置的感应,让观看者能够引发图像的变化,而不是完全由机器来控制。重要的莫过
于电脑能跟踪头部的转动并能回应它的快速变化。图像更新的速度(频率响应)实际上比分
辨率更为重要。由此可见我们的运动神经系统是多么敏锐,即使最轻微的反应迟钝也会破坏
整个感官经验。
大多数的制造商大概都会完全忽略这一点,而把早期拼命强调图像的高分辨率的虚拟现
实系统推向市场。这样做的结果是牺牲了响应速度。其实,假如他们减少图形显示,加强图
像的防锯齿技术,并且加快响应速度,那么他们所提供的虚拟现实体验将会更加令人满意。
另外一个办法是,完全放弃为左右眼分别提供不同透视影像的头戴式显示器,而改用所
谓的自动立体效果技术,让真实的物体或全息影像在空中浮现,使双眼一起收视。《星球大
战》与全息术
到下个1000年中的某个时候,我们的孙子或曾孙将以一种新的方式观看足球比赛(如
果还那样叫的话)。他们会在咖啡桌(如果还那样叫的话)旁来回移动,让8英寸高的球员
在起居室(如果还那样叫的话)中任意驰骋,把一个半英寸高的足球踢来踢去。这个模式与
早期虚拟现实的想法完全相反。无论你从哪个角度观看,都能享受极高的分辨率。无论你朝
什么地方看,你看到的都是在空间浮动的三维像素。
在《星球大战》(StarWars)这部影片中,R2D2就用这种方式,把莉亚公主的影像投
射在欧比王的地板上。美丽的公主变成了投射在空间中如幽灵般的幻影,从任何角度(原则
上说)都能看得见。这种特殊效果,就像《星际旅行》和其他科幻电影中的类似效果一样,
无意间造就了一批对全息一类技术麻木淡漠的观众。我们在电影中看过太多类似的镜头,因
此误以为这种技术很容易。
事实上,发明白光全息术(今天这种技术普遍用在信用卡上)的麻省理工学院教授斯蒂
芬.本顿花了二十多年的时间,借助于价值上百万美元的超级计算机的力量,运用了几乎无
价的特殊光学仪器,再加上十几位出众的博士生孜孜不倦的努力,才得到了(与你在电影中
所看到的)类似的效果。
全息术(holography)是匈牙利科学家丹尼斯.盖博于1948年发明的。用最简单的话来
说,全息图像(hologram)就是把一个情境中所有可能的景象聚集在一个光调制模式下的单
一平面上。随后,当光束通过这个平面、或被这个平面反射的时候,原先的景像会在空间中
以光学方式重组,成为立体影像。100万倍的分辨率
在不断改进显示技术的精益求精的竞赛中,全息术一直是一匹实力难测、有可能后来居
上的黑马。其中一个原因是全息术要求极高的分辨率。你的电视应该有480条可见的扫描线
(也可以比这少得多),假如你的电视屏幕的高度是10英寸,那就是说你的电视机(在最
佳状态下)每英寸有差不多50条扫描线。全息术需要的分辨率是每英寸50000条扫描线,
即需要比你的电视机高出1000倍的水平扫描线。更糟的是,分辨率意味着在水平和垂直方
向同时扫描,这样全息术所需要的分辨率就是今天电视的1000倍,也就是100万倍。你在
信用卡甚至某些国家的钞票上能看到全息影像的原因之一,正是因为这种分辨率需要非常复
杂、难以仿造的印刷技术。
本顿和他的同事们之所以在全息技术方面有所建树,是因为他们聪明地找出了人类的眼
睛和感觉系统真正的需求,并把它与自然的全息图像所能制造的东西加以对照。既然人类的
眼睛是影像的接收器,那么向它呈现大多它无法分辨的细节就是一种愚蠢的做法了。同样
地,本顿注意到我们注视空间中正在形成的影像(从空间中取样)的方式,和我们注视电影
中单个画面(以时间来取样)的方式如出一辙。慢动作的影像差不多是每秒30帧画面(60
个扫描场)。由此,与其制造一个能够反映所有视点的全息图像,不如把它做成每英寸上有
一个视点而省略掉中间的其他数据的影像。他成功了。
除此以外,本顿和他的同事们还注意到,我们的空间感在很大程度上是一种水平空间
感。由于并列的双眼的视差,而且由于我们的视线总是沿着近平水平的方向移动,因此在我
们对空间的感觉中,水平视差比垂直视差(上下的变化)重要得多,水平视差所捕捉的空间
信号占了绝大多玖。假如我们的眼睛是一只叠在另一只的上面,或是我们经常在树上爬上爬
下,情形或许不同。但事实却非如此。事实上,水平视差对视觉的影响太大了,本顿后来决
定根本不去考虑垂直视差的问题。
因此,媒体实验室所展示的全息影像几乎都没有垂直视差。当我们向来访的人介绍本顿
实验室外悬挂的一组全息样品时,他们根本没有注意到这些样品是没有垂直视差的。事实
上,一旦我告诉他们这些图像没有垂直视差时,他们都会弯下腰来、再踞起脚尖反复地细
看,最后才真的相信。
空间取样结合水平视差(完全忽略垂直视差)的结果是,在本顿小组的手中,与制造一
个全分辨率的全息影像相比,如今只需要:%的电脑计算能力,就能得到这种新的影像。由
于这个原因,他们制造出了全世界第一个全彩的、由有深浅明暗变化的形体所构成的实时全
息影像。它自由地漂浮在空中,其大小和形状相当于一个茶杯或“矮胖”的莉亚公主。整体
大于部分之和
显示的质量确实不单和视觉有关。它是一种典型地运用了其他感官体验的收视经验。各
种感宫构成的整体的确大于部分之和。
在高清晰度电视刚刚萌芽的时候,当时在媒体实验室工作的社会科学家拉斯.纽曼进行
了一个划时代的实验,测试观众对显示质量的反应。他安装了两套一模一样的高清晰度电视
和录像机系统,放映一模一样的高质量录像带。不过,他在A组用的是录像机的普通音质和
电视机的小扬声器,而在日组中,则使用了很棒的扬声器,可以播放出比CD还要好的音
质。
结果令人吃惊。许多实验对象报告说日组的图像清晰得多。事实上,两组影像的品质完
全一样。但B组的收视经验却好得多。我们倾向于把感官经验作为一个整体来加以判断,而
不是根据各个部分的经验来加以判断。虚拟现实系统在设计上有时忽略了这个重要的观察结
果。
在设计军事坦克训练器的时候,人们花了很多心血,来达到最高的显示质量(几乎不计
任何代价),希望获得的效果是,当你注视显示器的时候,几乎就和从坦克的小窗口看出去
一样。这个想法挺好,但在不断增加扫描线数目上进行了艰苦卓绝的努力之后,设计师才想
到可以引入一种价格低廉、会稍稍震动的运动平“台。设计师又在此基础上增加了一些额外
的感官效果——坦克的马达声和轧过地面的声音棗结果整体感觉十分逼真,设计师因此可以
减少扫描线的数目,而不会影响整体视觉效果。无论如何,这个系统看起来和感觉起来很真
实,已经超过了原来的要求。
经常有人间我,为什么我吃东西的时候要戴着眼镜,因为我显然不需要眼镜,也能看得
见食物和刀叉。我的回答很简单,当我戴着眼镜的时候,食物显得更加美味可口。能够清楚
地看见食物是饭菜质量的一部分。
“看”和“感觉”相得益彰。
4、看和感觉让电脑看得见
跟装了传感器(sensor)的现代盥洗室或户外泛光灯比起来,个人电脑对人的存在的感
觉真是迟钝。便宜的自动对焦相机要比任何终端或计算系统都更清楚面前的景象,因而拥有
比电脑更高的智能。
当你从电脑键盘上抬起手来的时候,键盘不知道你是因为思考而暂停、是自然的休息,
还是跑出去吃午饭了。它分辨不出是在和你一个人讲话,还是它面前还站着另外6个人。它
也不知道你究竟是穿着晚装或宴会装,还是一丝不挂。因为如此,所以当它正在屏幕上显示
重要信息时,你可能正好背对着它;或是当它正在和你说话时,你可能正好走开,根本没听
见。
我们今天的着眼点完全放在如何使电脑更容易为人使用上。也许现在是问这样一个问题
的时候了:怎样才能使电脑更容易与人相处?打个比方,假如你不知道谈话对象究竟在不在
场,你怎么和他们讨论事情呢?你看不见他们,不知道他们共有多少人。他们面带笑容吗?
他们到底有没有集中注意力听你讲话呢?我们充满渴望地谈论人机互动和对话系统,然而我
们却存心把参与对话的一方留在黑暗中。
现在是该让电脑看得见、也听得见的时候了。读你干遍也不厌倦
关于电脑视觉的研究和应用长期以来几乎完全是针对情景分析的。这种情景分析尤其用
于军事上的目的,如无人驾驶车辆和智能炸弹。电脑在外层空间的应用也带动了科技的最新
发展。假如你让一个机器人在月球上漫游,机器人只是把看到的影像传给地球上的操作人员
还不够,因为即使用光速来传输,需要的时间仍然太长。假如机器人走到了悬崖边,等到人
类操作员看到录像中出现悬崖,赶忙把口信传到月球上,叫机器人别再往前走时,机器人早
就已经掉下去了。这只是情景分析的一个例子。在这种情况下,机器人必须根据它所看到的
情景,自己下判断。
科学家不但越来越了解影像,并且已经开发出一些技术,比如说,能从明暗度推测形
状,或把物体从背景中抽离出来。但是直到最近,科学家才开始审视电脑对人的识别能力,
以改进人机界面。事实上,你的脸就是你的显示设备,电脑应该能够读取它。因此,它必须
能辨认你的脸以及你独特的表情。
我们的表情和我们想要表达的内容息息相关。通电话的时候,我们不会因为电话线另一
端的人看不到我们,就面无表情。事实上,有时候为了加强口语的分量和语气,我们会更多
地调动脸部的肌肉,并伴有更夸张的手势。电脑可以通过感应我们的表情,接收到繁复而且
并行的信号,因此令我们的口语和文字讯息都更加丰富。
使电脑能够辨认人的脸部和表情,这是一个令人生畏的技术挑战。尽管如此,在某些情
况下,这一点还是完全可以实现的。在你和电脑一对一的情况下,电脑只需要知道操作电脑
的人是不是你,确定坐在它面前的不是地球上任何其他人就够了。此外,把人从背景中分离
出来也十分容易。
很可能在不久的将来,电脑就能看到你。1990年至1991年,海湾战争爆发之时,许多
商务旅行都被禁止,因此电信会议大量增加。此后,越来越多的个人电脑都配置了价格低廉
的电信会议设备。
电信会议的硬件包括一个架设在显示器上方中央的电视摄像头,以及能编码、解码和实
时地把影像全部或部分地显示在电脑屏幕上的硬件和软件。个人电脑将会越来越充分地为影
像通信做好充分准备,当初电信会议系统的设计者们并没有想到要把摄像头用在个人电脑
上,让我们享受到面对面的电脑通信。但是,这又何妨呢?人鼠之间
我们媒体实验室的尼尔.葛森菲尔德做过一个很有趣的研究:比较只要花几分钟便可学
会、价值30美元的鼠标,和要花一辈子才能精通、价值30000美元的大提琴弓。他对照了
16种运弓技巧和单击鼠标、双击鼠标和拖曳鼠标的动作。大提琴的弓是为音乐巨匠设计
的,而鼠标则是给你我这种人设计的。
就图形输入而言,鼠标是简单而又累赘的媒介。使用鼠标有4个步骤:1)摸索寻找鼠
标;2)晃动鼠标以找到光标;3)把光标移动到你希望的位置;4)单击或双击鼠标按钮。
苹果“强力笔记本”电脑的创新设计至少把这些步骤简化为3个,并且采用了一个“静止鼠
标”(最近又改成了“跟踪板”),可以随手指移动,因此使打字时所受的干扰减少到最低
程度。
画图的时候,鼠标和跟踪球就一筹莫展了。不信你试着用跟踪球来签签名看。在这种时
候,用“数据板”是个好得多的办法,也就是用像圆珠笔一样的笔尖,在一个平滑的表面上
操作。
配置了绘图数据板的电脑并不多,而那些配置了数据板的电脑又仿佛患了精神分裂症一
般,不知道该怎样安置数据板和键盘的位置才合适,因为两者最好都直接摆在显示器下方的
中央位置。解决冲突的方式通常都是把键盘放在显示器下方,因为大多数人(连我也在内)
根本不碰图案。
结果,数据板和鼠标都被摆在旁边,我们必须学会某种不大自然的手、眼协调方式。你
一边在下面操作数据板或鼠标,一边用眼睛盯住屏幕;也就是说,我们是靠碰触来作画的。
光笔与数据扳
鼠标是道格拉斯.恩格巴特在1964年发明的。当初他设计鼠标是为了指点文件,而不是
作画。但是这个发明却流传下来,而且今天随处可见。美国国家艺术基金会主席简.亚历山
大最近开玩笑说,只有男人才会想到把它叫做鼠标。
在她说这番话一年以前,伊凡.苏泽兰完善了直接用光笔在屏幕上作画的概念(50年
代,其防空系统曾使用过一些粗糙的光笔)。苏泽兰的方法是:跟踪由5个光点构成的十字
形光标。要停止绘图,只要抖一下手腕,退出跟踪就可以了。这是个精巧、但不太精确的终
止画线的方式。
今天,光笔事实上已经踪影全无。因为把手举在屏幕前是一回事(且不说当血液顺着手
掌不停地往下流时,要长时间保持这个姿势已经十分辛苦了),而拿着一管和电脑拴在一起
的、两盎斯重的笔,更会令手掌和手臂异常疲劳。有些光笔的直径达半英寸,用的时候感觉
就好像夹着雪前写明信片一样。
在数据板上画起图来则格外舒服,而且只要多费点心思设计,笔尖也能产生出如艺术家
画笔一样的质感和丰富效果。到目前为止,数据板通常让人感觉好像是用圆珠笔在一块平滑
而坚硬的板上作画,因此必须在桌面上靠近你和显示器的地方,为这块板找个安身之处。既
然我们的桌上已经堆满了东西,如果要让数据板流行起来,唯一的办法是家具制造商把数据
板直接做进桌面里,这样一来,就没有单独的数据板了,只有桌子本身。你的眼睛会说话
设想一下一面读着电脑屏幕上的文字,一面问:那是什么意思?她是谁?我怎么到了那
个地方?问题中的“那”、“她”和“那个地方”是由当时你眼睛注视的方向决定的。这些
问题牵涉到你的眼睛和文件的接触点。我们通常都不把眼睛当作输出装置,但我们却总是以
眼睛来输出信息。
人类能够觉察彼此目光的方向,并且进行视线的交流,这种本领当真神奇不已。想象一
下,站在20英尺以外的一个人有时候直视你的眼睛,有时目光却从你肩膀的上方穿过,注
视着远方。使此人目光注视的方向和你的视线只有不到一度的差距,你也能立刻感觉到其中
的差异。这究竟是怎么回事呢?
你当然不是用三角学的方法算出来的,换句话说,并不是计算另外一个人的视线是否与
你的视线相交。不,其中另有溪跷。你的眼睛和那人的眼睛之间一定传递了一个讯息,但我
们还不清楚个中奥妙。跟踪眼球的运动
总之,我们总是用眼睛来指示物体,当有人问你,某某人到哪里去了,你的回答可能只
是注视着敞开的房门。当你说明要带什么东西时,可能会盯着一个旅行箱,而不是另一个。
这种视线的指示,加上头部的动作,可以是非常有力的沟通渠道。
今天,已经有一些技术可以跟踪眼睛的运动。我最早看到的一种技术,是戴在头上的眼
球跟踪器(eyetracker)。当你读文件内容时,跟踪器会把屏幕上的文字从英文变成法文。
当你的中心视线不断地从一个字移到另一个字的时候,你看到的每个字都是法文,于是整个
屏幕看起来是百分之百的法文。但是,眼球没有被跟踪的旁观者看到的屏幕,却大约99%
都是英文(也就是说,除了戴着跟踪器的那个人正在看的字是法文外,其他的字都是英
文)。
更现代的眼球跟踪系统则采用远距离电视摄像头,因此用户不需要戴任何装置。能显像
的电信会议配置尤其适合进行眼球跟踪,因为用户往往隔着相对固定的距离坐在屏幕前面,
而且你通常都会注视着和你进行远端通信的那个人的眼睛(电脑会知道眼睛的位置)。
电脑越清楚你的位置、姿势和眼睛的特点,就越容易掌握你注视的方向。具有讽刺意味
的是,这种利用眼睛作为输入装置的异乎寻常的媒介可能最先应用在一个平淡无奇的结构
中,即坐在电脑桌前的人身上。
当然,如果你把眼睛(看)和另外一种输入工具——嘴巴(说)同时使用,效果会更
好。
5、咱们能不能聊聊弦外之音
对于大多数人而言,打字并不是一种理想的界面。假如我们能和电脑说话,那么即使是
最坚定的反机器分子,大概也会以更大的热情来使用电脑。但是,目前的电脑仍然又聋又
哑。这究竟是为什么呢?
电脑在语音识别方面一直没有多大的进展,主要原因不在于缺乏技术,而在于缺乏眼
光。每当我在语音识别的成果展示会或产品广告中,看到人们拿着麦克风说话时,我都很奇
怪:难道他们真的忘了,说话最大的价值之一就在于能让双手空出来做别的事情吗?当我看
到人们把脸贴近屏幕讲话时,我也很奇怪:难道他们忘了,能够遥控是使用声音的原因之一
吗?而当我听到人们要求设计出能够识别出各个独立用户的语音系统时,我问自己:他们是
不是忘了,我们是在和个人电脑说话,而不是在和公用电脑说话?为什么似乎每个人解决问
题的着眼点都落在错误的方面呢?
原因很简单。直到最近,我们一直被两个带有误导性的观念所驱使。第一个观念是受到
老式电话通信系统的影响,希望任何人在任何地方都能拿起话筒对电脑发号施令,而不需要
和接线员对话,而且不管说话的人怎样南腔北调都无关紧要。另外一个挥之不去的想法来自
于办公自动化——我们希望有一种会说话的打字机,我们对着它一口气不停他说,它能一字
不差地把我们的口述转化成文字记录下来。由于大家一直只把注意力放在这两个方面,使我
们拖延多年,始终无法实现一些更容易实现的(同时也是有用的)目标,即让电脑在高度个
人化而且互动的环境中,识别并了解对话内容。
我们也忽略了说话在文字以外的价值。举例来说,今天的电脑需要人全神贯注。你通常
都必须正襟危坐,同时把注意力放在互动的过程和互动的内容上。在走来走去时使用电脑,
或在有多组对话时让它参与其中的一组,简直是不可能的。语音识别可以改变这一切。
能够在一臂远的距离之外使用电脑,是非常重要的事情。想象一下,假如你和别人说话
的时候,他、她的鼻子尖老是凑到你的脸上,那是什么感觉!我们通常都隔着一定的距离与
别人讲话,偶尔还会转过身去同时做些别的事情。甚至有时已经走到别的地方而互相看不见
了,还在说着话。这种情况屡见不鲜。我希望有一部在“听力范围”之内的电脑,它必须能
把说话的声音和周围的杂音(例如空调或飞机在头顶上飞过的声音)区分开来。
讲话胜于文字的另一个原因是,它可以有其他附带方式来传递信息。家里有小孩或养了
宠物的人都知道,怎么样讲话可能比讲什么话更重要。说话的语气非常关键。例如,不管主
人如何吹牛,说他、她宠爱的小狗如何如何,小狗似乎只对语调有反应,它内在的分析复杂
词汇的能力基本为零。
说出来的话除了字面的意思之外,同时传递了大量的信息。讲话的时候,我们使用完全
一样的字眼,可以表达或激情洋溢、或嘲讽、或愤怒、或闪烁暧昧、或曲意逢迎、或精疲力
竭等等不同的情绪。在电脑语音识别的研究中,大家都忽略了这些细微的差异,更糟的是,
把它们视为暇疵,而不是特点。然而,正是这些特质,使说话成为比打字更丰富的输入媒
介。让电脑“听话”
假如你的外语能力还不错,但是还不到应对自如的地步,你会发现,要听懂饱受杂音干
扰的新闻广播实在很困难。相反,对于一个能把外语说得极为流利的人而言,这些杂音充其
量只是扰人罢了。识别语言和理解语言,二者密不可分。
目前,电脑无法像你我一样,先对某件事的意义建立共识,进而理解事物的意义。虽然
未来的电脑无疑会具有更多智能,目前我们仍不得不先设法解决机器的语音识别能力问题,
而把机器的理解力问题搁置一边。一旦把这两项任务予以分化,路该怎么走就很清楚了,我
们必须把口语中的单字,变成电脑可读的命令(command)。语音识别问题有三个变数:词
汇量、机器对说话者的依赖程度以及字的关联性,所谓字的关联性,是指机器能在多大程度
上依照人们日常讲话中的自然强弱节奏把单字含混在一起。
我们可以把语音识别的这三个方面想象成三维立体轴。在词汇轴上,需要识别的字越
少,对电脑而言就越容易。假如系统事先就知道说话的人是谁,问题就更简单了。如果说话
的人能一个字一个字分开发音,电脑就听得更明白,识别起来也就更容易。
在这三条轴的起始点,我们可以找到少得不能再少、完全依赖于说话者语音的词汇,念
出这些词汇的时候,字与字之间必须有明——显——的——停——顿。
当我们顺着任何一条轴移动的时候,也就是说,增加电脑所能识别的词汇,让系统能够
服务于任何说话者,或是容许字与字相连的程度越来越高,在这种情况下,每前进一步,都
会使问题变得越来越困难。当到达三条轴的远端时,我们期望电脑能够识别任何人说的任何
字,以及“印(任)何程度”的含混字。人们通常都认为,我们必须在两条或三条轴上都达
到最远端时,语音识别系统才能对人类有用。这完全不对。
让我们一个一个来考虑。谈到词汇多寡的时候,我们可能会问:多少才算多呢,500、
5000还是50000个字?但这个问题其实应该是:在任何时候,电脑存储器中究竟需要多少
它可以识别的单字?这个问题提示我们把词汇根据上下文分成组,这样在需要的时候就可以
把大群词组放进存储器中。当我要求我的电脑接听电话时,它会把信息输入我的电子电话
本。当我计划到什么地方旅行时,它则把地名输入到上面。
假如你把词汇量看成在任何情况下都需要的一组字——称为“字窗”(wordwindows)
一那么电脑只需要从一个小得多的字音库中拣字就可以了,这一字音库只要有500个字左右
就够了,不需要50000个那么多。
人们所以假设需要有能够识别各个独立讲话人的语音识别系统,是由于这种功能是过去
电话公司的一项要求,电话公司的中央电脑必须能听懂每个人的话,提供一种“通用服
务”。今天,电脑的普及率更高,而且更加个人化。我们在网络的外围——通过个人电脑、
话筒,或经由一小块智能卡(smartcard)的协助,能够完成更多的语音识别。如果我想在
电话亭里和一部航空公司的电脑谈话,我可以先接通我的家用电脑或拿出我的袖珍型电脑,
让它先替我把声音转换成机器看得懂的信号,然后,再和航空公司的电脑联络。
第三个问题是字音的模糊性问题。和电脑说话的时候,我们不希望像一个观光客对外国
小孩说话一样,夸张地吐出每个单字,而且每念一个字,都停顿一下。因此这个轴最具挑战
性。但是我们也可以把问题稍稍简化,也就是把语言看成许多字一起发出的声音,而不是许
多单个字的声音。事实上,处理这种连成一片的字音,很可能正是你的电脑走向个人化的必
经过程和必须接受的训练的一部分。
当我们把讲话看成一种互动的和对话的媒介时,我们离语音识别中最容易的那部分已经
没有多远了。字典里找不到的字
讲话这种媒体常常充斥着字典里找不到的字音。言谈不仅比白纸黑字更多姿多彩,而且
对话中的特点,例如形体语言这样的非文字语言的运用,往往能使对话浮现额外的意义。
1978年,我们在麻省理工学院采用了一套先进的、依赖于说话者发音的、能够识别连
续语音的语音识别系统。但是就像当时和现在的许多同类系统一样,当说话者的声音中带有
哪怕些微的紧张时,系统就会失误。当研究生向我们的赞助者演示这套系统时,我们希望它
表现得完美元缺。结果,由于过度焦虑,作演示的研究生声音绷得紧紧的,系统也就完全失
灵。
几年以后,另外一个学生想到一个绝妙的主意:找出用户说话时会在什么地方停顿,并
且设走电脑程序,让电脑在适当的时候发出“啊哈”的声音;这样,当一个人和机器说话的
时候,机器每隔一会几就会发出“啊哈——”、“啊——哈”或“啊哈”。这些声音产生了
极大的安抚效果(就好像机器在鼓励使用者继续对话),使用者变得比较放松,而系统的表
现也突飞猛进。
这个观念体现了两点重要的意义:第一,并非所有的发音都需要有字面上的意义,在沟
通中才有价值;第二,有些声音纯粹只是对话中的礼仪。当你接电话的时候,没有以适当的
间隔对来话人说“嗯”,来话人会变得很紧张,而且最终会探问:“喂,你在听吗?”“啊
哈”或“嗯”的意思不是“是”、“否”或“也许”它基本上是在传达一个比特的信息:
“我在这里”。并行的表达
想象一下这样的情景:你和一群人围坐在一张桌子旁,同桌的人除了你以外都说法语。
你只在中学粗粗修过一年蹩脚的法语、突然有个人转过头来对你说:“还要来点几酒吗?”
你完全听懂了。接着,这个人把话锋一转,谈起法国的政治来了。除非你能说流利的法语,
否则就跟听外星人讲话一样(而且即便你法文流利,也不一定能懂)。
你可能会想:“还要来点儿酒吗?”是小孩都听得懂的简单法文,而政治就需要更精深
的语言技巧了。不错,但这并不是两段对话的重要区别所在。
当有人间你要不要添一点酒的时候,他可能正伸长了手臂去拿酒瓶,眼睛也正注视着你
的空酒杯。也就是说,你正在解码的信息并不只是声音而已,而是并行而累赘的多重信息。
而且,所有的主体和客体都处于同一时空。这种种条件同时作用的结果才使你能听懂他的意
思。
我要重申,累赘是件好事。并行信道(手势、眼神和谈话)的使用是人类沟通的核心。
人类自然而然地倾向于使用并行的表达方式。假如你只会讲一点点意大利语,和意大利人通
电话将会非常辛苦。但当你住进一家意大利旅馆,发现房间里没有香皂时,你不会拿起电
话,而会直接下楼,走到前台值班员那里,拿出你在语言速成学校学会的所有看家本领,让
他拿香皂给你,你甚至一边说一边还会做几个洗澡的动作。
身在异地时,我们会用尽一切办法,来传达我们的意图,并且解读所有相关信号,力求
索解出哪怕一丁点意思。电脑正是身处这样的异地——人类的土地上。让电脑开口
要电脑说话,有两种方式:重放先前录下的声音,或合成字母、音节或(最可能的是)
音素的声音。两种方式各有利弊。让电脑说话和音乐的制作一样,你可以把声音存储下来
(就像CD一样),然后重播,也可以采用合成的方式,根据曲调,重制音乐(就像音乐家
一样)。
重述先前存储的说话内容,也就回到了听起来最“自然”的口、耳沟通方式,尤其是当
我们存储的是一个完整的讯息时,就更显得如此。由于这个原因,大多数的电话留言都是以
这种方式录制的。当你试图把录好的片段声音或个别单字拼凑起来的时候,结果就比较不如
人意了,因为整体的韵律不见了。
过去,人们不大愿意用预录的谈话来作人机界面,因为这样会消耗电脑大多的存储容
量。今天,它已经不太成问题了。
真正的问题也正是最明显的问题。你必须提前把话录下来,才能运用预录的谈话。假如
你期望电脑说话的时候,不要把名字弄错,那么你就得先把那些名字存储起来。存储好的声
音不能适用于随机的讲话。由于这个原因,人们使用了第二种方式——合成。
语音合成器会根据一些规则,把一串文字的内容逐字念出来(就跟你念这句话时没什么
两样)。每一种语言都有所不同,因而合成的难易度也不尽相同。
英语是最难合成的语言之一,因为我们以一种奇怪而且似乎不合逻辑的方式来书写英
文。其他一些语言,例如土耳其语,就容易多了。事实上,要合成土耳其语非常容易,因为
基马尔在1929年把土耳其语从使用阿拉伯字母改为使用拉丁字母,这样转换的结果,使声
音和字母之间形成了一一对应,每个字母都发音:没有不发音的字母或令人困惑的复合元
音;因此,在单字的层次上,土耳其语简直令电脑语音合成器的美梦成真。
即使机器能够发出每一个和任何一个单字的音,还有别的问题。把合成的字音集合起
来,在词组或句子的层次上,加上整体的节奏和语气,是非常困难的事情。然而这样做非常
重要,不仅能让电脑说的话好听,而且还能根据说话的内容和意图表现出不同的色彩、表情
和语调。否则,电脑发出来的声音就好像醉酒的瑞典人在喃喃自语一样单调得让人倒胃口。
我们现在开始看到(听到)有些系统正把语音合成和声音存储两种方式结合在一起,随
着数字化越来越普遍,最终的解决方案将是两者合一。小型化的趋势
在下一个千年里,我们会发现我们和机器说的话,与我们和人类说的话一样多,或甚至
比跟人类说的话还要多。和没有生命的物体说话时,人们最感困扰的似乎是自我意识问题。
我们跟狗和金丝雀讲话的时候,觉得非常自在,但是和门把手或灯柱说话,就会觉得怪怪的
(除非你烂醉如泥)。难道我和烤箱说话的时候会不觉得傻乎乎吗?大概跟对着电话应答机
讲话半斤八两吧。
小型化(miniaturization)的趋势将使今天的语音输入比过去更遍及于每一个角落。
电脑正变得越来越小,昨天还占据了整个房间的电脑设备,今天已出现在你的桌面上,明天
你更可以把袖珍型电脑戴在手腕上。
许多桌上型电脑用户都不能充分认识过去10年来电脑体积的缩小幅度,原因是电脑体
积的变化包含不同的方面,例如键盘的尺寸仍然尽可能保持不变,而显示器反而变大了。因
此,今天桌上型电脑的整体大小仍和15年前的苹果型机不相上下。
如果你已有很长时间未曾使用调制解调器,调制解调器大小的变化更足以说明真正的变
化有多大。不到15年以前,一个速率1200波特的调制解调器(价格约1000美元)几乎像
一个侧躺的烤箱一样大。当时,速率9600波特的调制解调器就像一个放在架子上的大铁笼
子一样。然而到了今天,你可以在一块智能卡上找到速率为19200波特的调制解调器。即使
已经把调制解调器做成倍用卡般大小,我们仍然有许多空间没有好好利用,现在的设计有相
当部分纯粹是为了外型的缘故(为了填满插口,或是大得让我们能握住,而不会随便弄
丢)。我们所以没有把像调制解调器这样的东西装在“大头针头”上,主要不是技术上的原
因,而是因为我们很容易把大头针随手乱放,再找起来很困难。
一旦挣脱了手指张开幅度的束缚(手指张开的幅度决定了一个舒适合用的键盘的形状和
大小),电脑的大小就会更多地受到衣兜、钱夹、手表、圆珠笔和其他类似物品的体积的影
响。在这种种形式中,信用卡很接近我们想要的最小尺寸,显示器很小,因此图形用户界面
变得没有多少意义了。
笔形的系统很可能被视为笨拙的过渡期工具,既太大,又太小。按钮式的设计也不理
想。看看你的电视机和录像机遥控器,你就会明白按钮的局限所在:按钮式装置完全是为手
指纤细、眼力极佳的年轻人设计的。
由于以上种种原因,小型化的趋势必然会推动语音制造和语音识别技术的提高,并促使
语音识别成为附在小型物体上的电脑的占支配地位的人机界面。实际的语音识别系统不需要
一定装在袖扣和表链中。小型装备可以通过通信而提供帮助。关键在于,小型化了以后,就
必须靠声音驱动。打电话,传心曲
很多年以前,霍尔马克卡片公司(Hallmarkcards)开发部的主任告诉我,他们公司主
要的竞争对手是AT&T。“打电话,传心曲”的广告词说的是,透过声音,传达感情。声音
的渠道不仅传递了信号,同时也传递了所有伴之而来的理解、深思、同情或宽容。我们会
说,某人“听上去”很诚实,这个论点“听起来”不怎么可靠,或某件事“听起来”不像那
么回事。声音中潜藏了能唤起感觉的信息。
同“打电话、传心曲”一样,我们会发现我们也将能通过声音把我们的希望传达给机
器。有些人会表现得像教官一样未教导他们的电脑,另一些人则会用理性的声音。说话和授
权密不可分。你会不会对七个小矮人发号施令呢?
有可能的。20年后,你可能对着桌上一群八英寸高的全息式助理说话。这种预想一点
也不牵强。可以肯定的是,声音将会成为你和你的界面代理人之间最主要的沟通渠道。
6、少就是多老练的英国管家
1980年12月,魏思纳和我在鹿内信隆(《产经新闻》、富士电视台前会长)可爱的乡
间别墅作客。别墅位于日本的箱根地区,离富士山不远。我们深信,参与媒体实验室的创建
将使鹿内先生的报纸和电视传媒王国获益良多,因此他会乐于资助媒体实验室的创办。我们
更进而相信,鹿内先生个人对现代艺术的兴趣,将和我们试图融合科技与艺术表现、把新发
明与对新媒体的创造性应用结合在一起的梦想不谋而合。
晚餐前,我们一边散步,一边欣赏鹿内先生著名的户外艺术收藏,这里在白天是箱根露
天美术馆。当我们与鹿内夫妇一起共进晚餐时,鹿内先生的私人男秘书也在一旁陪同。鹿内
先生对英文一窍不通,他的秘书却能说一口漂亮的英语,在我们的沟通中担任重要的角色。
魏思纳先打开话头,说他对卡尔德的作品很有兴趣,然后介绍了麻省理工学院和他自己与这
位大艺术家的渊源。秘书听完整个故事后,再从头到尾用日文翻译一遍,鹿内先生仔细聆
听。最后,鹿内先生沉吟片刻,然后抬起头来,看着我们,好像幕府将军一样发出“喔—
—”的声音。
秘书于是翻译道:“鹿内先生说,他也很欣赏卡尔德的作品,他最近买到的作品是
在……”且慢,鹿内先生说过这些话吗?
整个晚餐中,这样的情形一再出现。魏思纳先说几句话,秘书把它全部译成日文,鹿内
先生的回答差不多都是千篇一律的“喔喔——”,但秘书却有办法译出一大堆解释来。那天
晚上,我告诉我自己,假如我要制造一部个人电脑,它一定要跟鹿内先生的秘书一样能干。
它必须具有能细致入微地了解我和我身边环境的功能,能够自动引申或压缩信号,因此大多
数场合,我反而成为多余的了。
关于人机界面,我所能想到的最好的比喻就是老练的英国管家。这位“代理人”能接电
话,识别来话人,在适当的时候才来打扰你,甚至能替你编造善意的谎言。这位代理人在掌
握时间上是一把好手,善于把时机拿捏得恰到好处,而且懂得尊重你的癖好。认识这位管家
的人比一位全然的生客多占了许多便宜。这真是不错。爱因斯坦都帮不上忙
能够享受到这种人性化代理人服务的人寥寥无几。我们平日更常见到的一种类似角色是
办公室的秘书。假如秘书很了解你和你的工作,他就能非常有效地充当你的代表。假如有一
大秘书生病了,临时工介绍所即使把爱因斯坦派来,也会于事无补。因为重要的不在于智
商,而在于彼此之间有没有共识,以及当秘书运用这种共识时,能不能为你的最佳利益着
想。
一直到最近,使电脑具备这样的功能仍是遥不可及的梦想,因此许多人并没有把这个概
念当成一回事。但是,情势瞬息万变。现在,有不少人认为这样的“界面代理人”是可行的
构想。因此,过去问者寥寥的“智能型代理人”构想现在摇身一变,成为电脑界面设计领域
最时髦的研究课题。很显然,人们希望委托电脑来执行更多的功能,不想事事都亲自操作。
我们的构想是设计一个知识丰富的界面代理,它不仅了解事物(某件事情的流程、某个
感兴趣的领域、某种做事的方式),而且了解你和事物的关系(你的品味、倾向,以及你有
哪些熟人)。也就是说,这部电脑应该有双重特长,就像厨师、园丁和司机会运用他们的技
能来迎合你在食物、园艺和驾驶方面的品昧和需求一样。当你把这些工作交由别人执行时,
并不表明你不喜欢烹饪、园艺或开车,而是表明你可以选择在你想做的时候做这些事情,并
且,这是因为你想做,而不是不得不做。
我们和电脑之间的关系亦是如此。我实在没有兴趣在上网之后先进入一个系统,再通过
一堆通信协议,才能找到你的互联网络地址(address)。我只想把讯息传递给你。同样
地,我不希望只为了确认没有错过什么重要信息,就被迫阅读几千个电子公告牌。我希望让
我的界面代理为我代劳。
会有许多数字化管家,他们有些住在网上,有些就在你身边,还存在于组织的中央系统
和外围设备中(无论组织是大是小)。
我跟别人讲过,我有二台心爱的智能型寻呼机。它能用完美无缺的英语句子适时地给我
传递重要的信息,简直聪明极了。我的办法是,只让一个人拥有寻呼机的号码,所有的信息
都通过他来传递,只有他才知道我在哪里、哪些事情比较重要,以及我认识哪些人(和他们
的代理人)。智慧来自系统的数据转发器(headend)而不是外围,也不在寻呼机身上。
但是,接收端也应该具有智慧。最近,一个大公司的首席执行官和他的助理来访。这位
助理带着老板的寻呼机,他会在最适当的时机,提醒老板一些急事。这位助理这种老练的、
懂得把握时机和慎谋善断的本事,将来都会设计到寻呼机的功能中。《我的日报》
想象一下,假若电子报纸能以比特的形式传送到你的家中,假设这些比特都传送到一个
神奇的、像纸一样薄的、有弹性的、防水的、无线的、轻巧明亮的显示器上,要想为这份报
纸设计界面,可能需要借助人类多年在制作标题、设计版面上的经验、印刷上的突破、图像
处理上的经验及其他许多技术,来帮助读者浏览阅读。做得好的话,它可能会成为一种伟大
的新闻媒体;做得不好的话,就会惨不忍睹。
我们可以从另外一个角度来看一份报纸,那就是把它看成一个新闻的界面。数字化的生
活将改变新闻选择的经济模式,你不必再阅读别人心目中的新闻和别人认为值得占据版面的
消息,你的兴趣将扮演更重要的角色。过去因为顾虑大众需求而弃之不用、排不上版面的文
章,现在都能够为你所用。
想想看,未来的界面代理人可以阅读地球上每一种报纸、每一家通讯社的消息,掌握所
有广播电视的内容,然后把资料组合成个人化的摘要。这种报纸每天只制作一个独一无二的
版本。
事实上,我们在周一早上读报的方式和周日下午截然不同。在工作日里,早上7点钟测
览报纸只是过滤信息,从传送给成千上万人的共同比特中,撷取符合个人需要的部分。大多
数人对整版整版的报纸,会看也不看一眼就丢进垃圾桶,对剩下的一些版面稍作浏览,真正
细看的部分寥寥无几。
假如有家报业公司愿意让所有采编人员都照你的吩咐来编一份报纸,又会是什么情景
呢?这份报纸将综合了要闻和一些“不那么重要”的消息,这些消息可能和你认识的人或你
明天要见的人有关,或是关于你即将要去和刚刚离开的地方,也可能报道你熟悉的公司。在
这种情况下,假如你确信《波士顿环球报》能提供正好符合你需要的信息,你可能愿意出比
100页的《波士顿环球报》高得多的价钱,来买一份只有10页、但专门为你编辑的《波士
顿环球报》。你会消耗掉其中每一个比特。你可以称它为《我的日报》(TheDailyMe)。
但是,到了星期天下午,我们希望以比较平和的心情来看报纸,了解一些我们从来不知
道自己会感兴趣的事情,玩玩填字的游戏,看看好笑的漫画,顺便找找大减价的广告。这可
以称为《我们的日报》(TheDailyus)。在一个阴雨绵绵的星期天午后,你最不希望看到
的,就是有个紧张兮兮的界面代理拼命想帮你去掉看似不相干的信息。
这并不是非黑即白的两种截然相反的状态。我们往往在这两极之间游走,我们会根据手
头有多少时间、这是一天中的哪个时刻,以及我们的心情,希望获得较少或更多的个人化信
息。设想一个报道新闻的电脑显示器上面有个旋钮,你可以像调节音量一样,调整新闻内容
个人化的高低程度。你可以有许多不同的控制钮,包括一个可以左右滑动的钮,让你在阅读
有关公共事务的报道时,可以调整报道的政治立场(偏左或偏右)。
如此一来,这些控制钮就改变了你观看新闻的视窗,视窗的大小及其表现新闻的风格都
将发生变化。在遥远的将来,界面代理将阅读、聆听、观看每则新闻的全貌。而在不久的将
来,这种过滤的过程将借助于信息标题(也就是关于比特的比特)来完成。值得信赖的数字
化亲戚
在美国,《电视导报周刊》(TVGuide)的利润居然超过所有四家电视网利润的总和。
它所代表的意义是,关于信息的信息,其价值可以高于信息本身。当我们考虑新的信息发送
方式时,我们的思维总是拘泥于“随意例览信息”和“来回转换频道”这样的观念,这些观
念现在行不通了。当我们有1000个频道的时候,假如你从一个台跳到另一个台,每个台只
停留3秒钟,你就几乎要花1个钟头的时间,才能把所有频道从头到尾扫一遍。还没等你判
断出哪个节目最有趣,节目早就播完了。
当我想出去看场电影时,我不是靠读影评来选片,而是问我弟媳的意见。我们都有像这
样的亲戚朋友,他们对电影很内行,同时也很了解我们。我们现在需要的就是一位数字化的
亲戚。
事实上,这种体现为人帮人的“代理人”观念,常把专业知识与对你的了解揉合在一
起。好的旅行代理人会将其对饭店、餐厅的了解和对你的了解结合起来(线索通常来自于你
对其他饭店和餐厅的观感)。房地产代理人会从一系列或多或少能够满足你口味的房子中,
推测出你喜欢的家居模式。现在,来想象一下电话应答代理人、新闻代理人或电子邮件管理
人吧!他们的共同点都是能够模仿你做事的方式。
这不只是填一份调查问卷或对你有一个固定把握那么简单。界面代理人也必须像人类的
朋友和助理一样,不断学习和成长。这也是说起来容易,做起来难的事情。直到最近,我们
才稍稍了解,应该如何让脑模型学习有关人的事情。
当我谈到界面代理人时,经常有人问我:“你指的是人工智能吗?”答案是“没错”。
但是这个问题中夹杂着些微的怀疑,主要是因为过去人工智能给人们许多虚无的希望和过高
的承诺。此外,很多人对机器能够拥有智慧这样的观念,仍然深感不安。
大家公认阿伦.图宁(A1anTuring)在他1950年发表的论文《计算机器与智能》中首次
认真地提出机器智能这个概念。后来,马文.明斯基等先驱继续在纯粹人工智能的研究上进
行深入的探讨。他们向自己提出许多问题,诸如如何识别文本、了解情绪、欣赏幽默,以及
从一组隐喻推出另一组隐喻。比如在0,T,T,F,F这一连串英文字母之后,根据内在逻
辑,应该接哪些字母?
1975年左右,当计算资源开始有能力解决直觉问题,并且表现出智能行为时,人工智
能的研究却滑向低谷。当时的科学家选择研究机器人技术(例如证券交易和民航订位系统)
这样的容易做到、而且有市场的应用技术,因此更深奥而根本的人工智能与学习问题,反而
无人问津。
明斯基很快指出,即便今天的电脑已经能异常出色地掌握班机订位状况(一件差不多越
出逻辑系统以外的事情),它们仍然无法表现出一个三四岁的小孩就具备的常识。它们讲不
出猫和狗有什么分别。像常识这样的课题,如今已经从科学研究的后台走到了舞台中央。这
一点非常重要,因为毫无常识的界面代理人会让你感觉有如芒刺在背。
顺便提一下,前面提到的那个接字母的问题,答案应该是S。这个顺序来自于英文数字
排列one(一)、two(二)、three(三)、four(四)、five(五)、six(六)、seven
(七)……中每个词的第一个字母(0,T,T,F,F,S,S)。从集权到分权
许多人往往把未来的界面代理人看成小说家乔治.奥威尔笔下中央集权、无所不知的机
器。其实,更可能出现的是许多电脑程序和个人化工具的组合,每一种工具都善于做某一类
事情并善于与其他程序沟通。这个形象是明斯基1987年出版的《心智的社会》一书的摹
本。他在这本书中指出,智能并非存在于中央处理器中,而是在许多具有专门用途、彼此紧
密联结的机器的集体行为中产生的。
这个观点打破了许多过去的成见。米切尔.瑞斯尼克在他1994年出版的著作《乌龟、白
蚁和交通阻塞》中把这种成见称为“集权心态”。我们受到的强化训练,使我们常把复杂现
象归因于某种作用体的一手操纵。比如我们通常都认为“人”字形的鸟群中最前面的那只是
头鸟,其余的鸟只是追随领袖而已。事实并非如此。秩序所以形成,是鸟群彼此高度回应的
个别行为而产生的集体结果。鸟群只不过遵循了简单的和谐规则,并没有任何一只鸟在中间
指挥大局。为了说明他的观点,瑞斯尼克还创造了一些情境,让许多人惊讶地发现自己也陷
入了同样的过程之中。
最近我在麻省理工学院的大礼堂中,亲身体验了瑞斯尼克的示范说明。在场的听众大约
有1200人。瑞斯尼克要求大家开始鼓掌,而且掌声尽量协调一致。结果,在瑞斯尼克完全
没有指挥的情况下,不到2秒钟,整个礼堂中就充满了节奏一致的鼓掌声。你不妨自己试试
看,即使在人数少得多的情况下,结果仍然令人目瞪口呆。观众错愕的反应说明,我们对于
从独立个体的行动中所产生的协调性的认识是多么肤浅。
这并不是说,为你安排日程的代理人因此毋需和你的旅行代理人协商,就径自安排会议
的日程。而是不是所有的信息往来和决定都需要中央权威的批示,这种方式或许不适合民航
订位系统,但却越来越被视为一种可行的管理组织和政府的方法。一个结构内部相互沟通、
权力分散的程度越高,它的适应力和存活力也就越强,也必然能更加持续地生存与发展。
长时间以来,分权的观念倍受称道,但是实际去做的时候,却寸步难行。互联网络提供
了全球性的交流通道,可以不受任何新闻检查的钳制,因此特别盛行于像新加坡这种新闻自
由很少、而网络却无所不在的地方。
界面代理人也会像信息和组织一样,逐步迈向分权式的结构。就像军队指挥官派侦察员
出去探路或县治安官派出一队保安一样,你也会派遣代理人为你收集信息。代理人会再指派
代理人。如此层层推演。但别忘了这个过程是怎么开始的:你把你的要求委托界面来完成,
而不是自己一头扎进环球网(WorldWideWeb)中东找西找。
这种未来的模式和加进人性因素的界面设计截然不同。界面的外观和给人的感觉固然重
要,但与智能相比就微不足道了。事实上,未来最通行的界面形式将会是塑料或金属上的一
个或两个小孔,里面有一个小麦克风来接收你的声音。
还有很重要的一点,就是要认清界面代理人的构想和目前大众对互联网络的狂热以及用
Mosaic浏览互联网络的方式之间存在着很大的不同。网络黑客(hacker)可以在这种新媒
体上冲浪、探索知识的海洋、沉溺于各种各样崭新的社交方式。这种环球同此凉热的互联网
络发烧现象不会减轻或消退,但它只是行为的一种而已,更像在直接操纵,而不是授权代
理。
我们的界面却将会出现形形色色的种类。由于大家各有不同的信息偏好、娱乐习惯和社
会行为,你的界面会有别与我的界面。大家在巨大的数字生活调色板上,各取所需。
1、后信息时代我就是我
长期以来,大家都热衷于讨论从工业时代到后工业时代或信息时代的转变,以致于一直
没有注意到我们已经进入了后信息时代。
工业时代可以说是原子的时代,它给我们带来了机器化大生产的观念,以及在任何一个
特定的时间和地点以统一的标准化方式重复生产的经济形态。信息时代,也就是电脑时代,
显现了相同的经济规模,但时间和空间与经济的相关性减弱了。无论何时何地,人们都能制
造比特,例如,我们可以在纽约、伦敦和东京的股市之间传输比特,仿佛它们是三台近在咫
尺的机床一样。
信息时代中,大众传媒的覆盖面一方面变得越来越大,另一方面又变得越来越小。像有
线电视新闻网、《今日美国报》这种新形态的传播媒介拥有更广大的观众和读者,其传播的
辐射面变得更为宽广。针对特定读者群的杂志、录像带的销售和有线电视服务则是窄播的例
子,所迎合的是特定的较小人群的口味。所以大众传媒在这段时间内变得既大又小。
在后信息时代中,大众传播的受众往往只是单独一人。所有商品都可以订购,信息变得
极端个人化。人们普遍认为,个人化是窄播的延伸,其受众从大众到较小和更小的群体,最
后终于只针对个人。当传媒掌握了我的地址、婚姻状况、年龄、收入、驾驶的汽车品牌、购
物习惯、饮酒嗜好和纳税状况时,它也就掌握了“我”——人口统计学中的一个单位。
这种推理完全忽略了窄播和数字化之间的差异。在数字化生存的情况下,我就是
“我”,不是人口统计学中的一个“子集”。
“我”包含了一些在人口学或统计学上不具丝毫意义的信息和事件。你无法从我的岳母
住在哪里、昨晚我和谁共进晚餐,以及今天下午我要搭乘几点的班机到弗吉尼亚州的里士满
去这类事情中,找出关联性或统计学上的意义,并且从中发展出适当的窄播服务。
但是,这些与我有关的信息却决定着我想要的新闻服务可能和某个不知名的小镇或某个
没什么名气的人有关,而且我也想知道(今天)弗吉尼亚的天气状况如何。古典人口统计学
不会关注数字化的个人,假如你把后信息时代看成超微的人口统计学或高度集中化的窄播,
那么这种个人化和汉堡王(BurgerKing)广告词中所标榜的“按你喜欢的方式享受汉堡”
(HaveltYourWay)没什么两样。
真正的个人化时代已经来临了。这回我们谈的不只是要选什么汉堡佐料那么简单,在后
信息时代里机器与人就好比人与人之间因经年累月而熟识一样:机器对人的了解程度和人与
人之间的默契不相上下,它甚至连你的一些怪僻(比如总是穿蓝色条纹的衬衫)以及生命中
的偶发事件,都能了如指掌。
举个例子,你的电脑会根据酒店代理人所提供的信息,提醒你注意某种葡萄酒或啤酒正
在大减价,而明天晚上要来作客的朋友上次来的时候,很喜欢喝这种酒。电脑也会提醒你,
出门的时候,顺道在修车厂停一下,因为车子的信号系统显示该换新轮胎了。电脑也会为你
剪下有关一家新餐馆的评论,因为你10天以后就要去餐馆所在的那个城市,而且你过去似
乎很赞同写这篇报道的这位美食评论家的意见。电脑所有这些行动的根据,都是把你当成
“个人”,而不是把你当成可能购买某种牌子的浴液或牙膏的群体中的一分子。没有空间的
地方
后信息时代将消除地理的限制,就好像“超文本”挣脱了印刷篇幅的限制一样。数字化
的生活将越来越不需要仰赖特定的时间和地点,现在甚至连传送“地点”都开始有了实现的
可能。
假如我从我波士顿起居室的电子窗口(电脑屏幕)一眼望出去,能看到阿尔卑斯山
(A1ps),听到牛铃声声,闻到(数字化的)夏日牛粪味儿,那么在某种意义上我几乎已经
身在瑞士了。假如我不是驾驶着原子(构成的汽车)进城上班,而是直接从家里进入办公室
的电脑,以电子形式办公,那么,我确切的办公地点到底在哪儿呢?将来,休斯敦
(Houston)的医生将可以通过电信和虚拟现实的技术,为远在阿拉斯加(Alaska)的病人
做精细的手术。尽管在近期内,脑外科手术仍需要医生和病人在同时同地才能进行;但是,
脑力劳动者的许多活动,由于较少时空的依附性,将能更快地超越地理的限制。
今天,许多作家和理财专家发现到南太平洋或加勒比海的小岛上写稿或理财不仅可行而
且更有吸引力。但是,像日本这样的一些国家却要花更长的时间,才能摆脱对时空的依赖,
原因是本土文化抗拒这种趋势。举个例子,日本之所以不肯实行夏时制的主要原因之一是,
那里的上班族一定要“天黑”以后才能下班回家,而且普通工作人员一走要上班比老板早
来,下班比老板晚走。
在后信息时代中,由于工作和生活可以是在一个或多个地点,于是“地址”的概念也就
有了崭新的涵义。
当你在美国联机公司、电脑服务公司或奇迹公司开户的时候,你知道自己的电子邮件地
址是什么,但不知道它实际的位置在哪里。如果你享受的是美国联机公司的服务,则你的互
联网络地址是你的标识符(in)再加上
知道
现在人究竟在哪里。这个地址不像街道座标,反而更像社会保险号码。它是个虚拟的地址。
就我来说,我碰巧知道自己的电子邮件地址
一部已经用了10年之久的惠普Unix机,就放在离我办公室不远的小房间里。但是,当人们
发送讯息给我的时候,他们写给我而不是给那个房间。他们可能推测我人在波士顿(通常都
并非如此)。事实上,我经常与他们不在同一时区,因此不光空间改变,连时间也改变了。
非同步的交流方式
面对面的谈话或两人在电话上的交谈都是实时的同步的交流。我们做“电话迷藏”
(telephonetag)的游戏也是为了要找到同步沟通的机会。具有讽刺意味的是,我们这么做
往往是为了彼此交流意见,但实际上意见的交换完全不需要同步进行,采用非实时的信息传
递方式,其效果毫不逊色。从历史上看,非同步的交流方式,例如写信,倾向于采取一种比
较正式的,无法即兴发挥的形式。但是,随着语音邮件(v-oicemail)和电话应答机的出
现,情况已经大力改观。
有些人声称,他们简直无法想象他们(而且我们所有的人)过去家中没有电话应答机。
办公室也没有语音邮件的时候,日子是怎么过的。应答机和语音邮件的好处不在于录音,而
在于离线的信息处理的时间的转换。你可以留下口信,而不是非要在线上对话不可。事实
上,电话应答机的设计有点落伍,它不应该只在你不在家或你不想接电话时,才发挥作用,
而是应该随时都能力你接听电话,让打来电话的人可以选择只留口信而不必直接通话。
电子邮递所以有如此巨大的吸引力,原因之一是它不像电话那么扰人。你可以在空闲的
时候再处理电子邮件,因此,你现在可能会亲自处理一些过去在靠电话办公的公司里永远通
不过秘书这一关的信息。
电子邮递获得空前的流行,因为它既是非同步传输,又能让电脑看得懂。后者尤其重
要,因为界面代理人可以运用这些比特来排定讯息的优先次序,并以不同的方式来发送这些
讯息。发出讯息的人是谁以及讯息的内容是什么,都会决定你看到的讯息的次序,就好像公
司里为你筛选电话信息的秘书会让你6岁的女儿直接和你通话,而让某个公司的首席执行官
在电话线上等着。即使在工作忙碌的时候,私人的电子邮件仍然可能在成堆的待复邮件中排
在优先的位置。
我们的日常通信很多都不需要同步进行或实时处理。我们经常受到干扰,或被迫准时处
理一些并不真的那么紧急的事情。我们遵守有规律的生活节奏,不是因为我们总是在8点
59分结束晚餐,而是因为电视节目再过:分钟就要开始了。将来我们的曾孙可以理解为什
么我们要在某个特定的时间,到剧院去欣赏演员的集体表演,但他们将无法理解我们在自己
家中也非要同步收视电视信号的经验,除非他们能透视这种经验背后古怪的经济模式。随选
信息的天下
在数字化的生活中,实时广播将变得很少见。当电视和广播也数字化之后,我们不但能
轻易转换比特的时间,而且也不需要再依照我们消费比特的次序和速率来接收比特。比如,
我们可以在不到1秒钟的时间里,利用光纤传送1小时的视频信号(有些实验显示,传送1
小时vHS品质的视频信号可能只需要1%秒的瞬间)。换一种方式,如果我们采用的是细电
线或窄频无线电,我们可能就要花6个小时来传送10分钟的个人化新闻节目。前者把比特
一举发射到你的电脑之中,后者则是涓涓细流。
可能除了体育比赛和选举等少数例外之外,科技的发展方向是未来的电视和广播信号都
将采用非同步传输的方式,不是变成点播式的,就是利用“广捕”方式。“广捕”这个词是
1987年斯图尔持.布兰德在他那本关于媒体实验室的书中提出的。“广捕”指的是比特流的
放送。通常是把一串携带了庞大信息的比特放送到空中或导入光纤。接收端的电脑捕捉到这
些比特,检验它们,然后丢弃其中的大部分,只留下少数它认为你可能以后会用得着的比
特。
未来的数字化生活将会是“随选信息”的天下。当我们需要某种信息的时候,我们可以
直截了当地要求,或含蓄地暗示;因此靠广告商支持的电视节目制作需要一番全然不同的新
思考。
1983年,当我们在麻省理工学院开始创办媒体实验室时,人们觉得“媒体”是个贬义
词,是一条通往最低层次的美国大众文化的单行线。如果媒体(media)这个词的第一个字
母大写时,它几乎就等同于大众传媒(massmedia)。拥有广大的受众、会带来大笔的广告
收入,用来支付庞大的节目制作费用。无线的广播电视媒体更进一步确立了广告的正当性,
因为频谱是公众资产,信息和娱乐就应该“免费”为观众所享有。向广告说再见
另一方面,杂志采用的是私人发行网络,成本由广告商和读者共同分担。作为显然是非
同步传输信息的媒体,杂志提供了宽泛得多的经济和人口统计学模式,而且事实上可能为电
视的未来扮演先导的角色。在读者定位较窄的市场中繁衍成长并不一定会损害内容,而且杂
志还把一部分的成本负担转嫁到读者身上。有些专业杂志根本就没有广告。
未来的数字化媒体会更经常地采用论次计费的方式,而不只是建立在要么什么都有。要
么什么也没有的基础上,它会更像报纸和杂志一样,由消费者和广告商一起分担成本。在某
些情况下,消费者可以选择接收不含广告的材料,只是得掏更多的钱。在另外一些情况下,
广告则变得非常个人化,以致于我们几乎分辨不清什么是新闻,什么是广告了。这时,我们
可以说,广告就是新闻。
今天,媒体的经济模式几乎都是把信息和娱乐大力“推”到公众面前,明天的媒体则会
同样或者更多地注重于“拉”力,你和我都入了网,可以像在图书馆或录像带出租点一样,
找出我们想要的资料。我们可以直接提出要求,或是由界面代理人替我们提出来。
这种没有广告的随选模式将把节目内容的制作变得好像具有丰富声响和画面效果的好莱
坞电影一样,风险更大,而回报也更丰厚,经常会出现大起大落。如果你成功了,金钱就会
滚滚而来。如果钱来了,那太棒了;如果失败了,真糟糕,但是这回风险不见得会由宝洁公
司(Procier&Gamble)这样的广告商来承担。因此,明天的媒体公司将会比今天投下更大
的赌注,同时一些小公司会投下比较小的赌注,分得一部分的观众份额。
未来的黄金时段(primeiime)将不再因为代表了人口统计学上一群潜在的豪华汽车或
洗涤灵购买者而占尽风光。是不是黄金时段,完全取决于我们眼中所见的品质。
2、黄金时段就是我们的时段供出租的比特
许多人认为“视频点播”将作为新技术的种极,其成功的应用而为信息高速公路提供资
金的支持。他们的推理是:假设一家录像带出租点拥有4000盘带子,它发现其中5%的带
子的出租率占了所有出租带的60%。这5%的带子很可能是刚发行的新片,假如它拥有更多
这些带子的拷贝,出租率可能还会更高。
研究了录像带出租的这些特点后,我们很容易得出一个结论:电子视频点播系统应该只
提供最受欢迎的5%的影片,其中主要是新片。这样做不但会很方便,而且还可以为在某些
人眼中尚在实验阶段的这种形式提供具体而有说服力的证据。
否则,我们要花太多的时间和金钱,来将(假定说)1990年为止美国拍摄的所有电影
数字化。假如要将美国国会图书馆中珍藏的250000部影片全部数字化,需要的时间就更多
了,至于欧洲的电影,印度拍摄的成千上万部电影,或者墨西哥电视台每年制作的12000小
时的电视剧,就根本不用考虑了。问题依然是:我们大多数人真的只想观赏最受欢迎的那5
%的影片吗?还是,这只是传播原子的旧科技所带来的群体现象?
1994年,布罗克巴斯特公司(Blockbusier)凭借其雄厚的企业基础大肆扩充,新开了
600家录像带出租点(扩充面积总计达500万平方英尺)。创办人韦恩.惠詹加宣称8700万
户美国家庭在过去15年中在录像机上的投资达300亿美元,好莱坞为卖给他录像带而下了
大赌注,不敢再签订视频点播协议了。
我不知道你怎么想,但是只要有好一点的选择,明天我就会扔掉我的录像机。对我来说
使用录像机就好比要携带(和归还)一大堆原子,怎么比得上不用归还、不用付押金的比特
呢?尽管我很敬佩布罗克巴斯特公司和它的新业主维康公司,我还是认为不出10年,录像
带出租业就会销声匿迹。
惠詹加的论点是,按次计费的电视(pay一per一viewte1evision)显然没能行得通;
那么视频点播凭什么会成功呢?但是出租录像带采取的正是论次计费的方式。事实上,布罗
克已斯特的成功,恰好证明了按次计费的方式是行得通的。目前,租借录像带和视频点播的
唯一差别在于,要例览商店里出租的原子,毕竟还是比例:览比特的菜单容易多了。但是,
情况正在迅速改变。富于想象力的、以代理人为基础的系统将会使电子例览器变得更迷人,
到那个时候,视频点播将不会像布罗克已斯特连锁店那样受限于几干种选择,而将提供可以
说是无限的选择。“无论何事、何时、何地”的电视
全球电话业最资深的几位经理人员把“无论何事、无论何时、无论何地”这句话念得琅
琅上口,好像是一首歌颂现代社会的流动性的诗歌一般。但我的目标(我想你的目标大概也
会如此)是,除非是适时的、重要的、有趣的、相关的或者能激发我的想象力的事情,否则
的话我宁可“没有任何事情,永远也不会,不在任何地方”。作为电信的范式,“无论何
事、无论何时,无论何地”的口号已经陈腐不堪,但是用它来思考电视的新境界,却很不
错。15000个电视频道
当我们听到1000个电视频道的说法时,我们很容易忘记,即使没有卫星,我们每天在
家里也已经可以接收到1000多个电视节目。这些节目24小时连续播放,包括在一些很奇怪
的钟点也一样播放。假如我们把《卫星电视周刊》上面列的150多个电视频道也包括在内的
话,我们一天可以收看到的节目又多了2700个或更多。
假如你的电视能把每个节目都录下来的话,你所获得的选择就已经5倍于大多数人心目
中信息高速公路所能提供的数目。假定说,你不保留所有的节目,而让你的电视代理人挑出
其中一两种你可能感兴趣的节目,录下来供你以后随时欣赏。
现在,让我们把“无论何事、无论何时、无论何地”的电视扩展为一个拥有15000个电
视频道的全球构架,这时我们会发现电视在数量和质量上都发生了有趣的变化。有些美国人
可能会收看西班牙电视来提高他们的西班牙语水平,其他人可能会收看瑞士有线电视第11
频道上未加剪辑的德国成人节目(在纽约时间下午5点播出),而200万希腊裔美国人可能
会很有兴趣地观看希腊3家全国性电视台或7个地区性频道的节目。
或许,更有趣的是,英国人每年会花75小时转播国际象棋冠军争夺赛,而法国人则会
花80小时收看环法自行车大赛。美国的棋迷和自行车迷自然也会乐于观赏这类节目——无
论何时,无论何地。
假如我正打算造访士耳其的西南海岸,我可能没法找到一部关于博德鲁姆(Bodrum)这
个地方的纪录片,但是我可以从《国家地理杂志》、美国公共广播公司、英国广播公司和其
他几百种资料来源中,找到有关建造木船、晚间捕鱼、海底古迹、东方地毯等的影片片断或
图片。我可以把这些片断组合起来,编辑成一个恰好适合我的特殊需要的片子。这个片子不
太可能赢得奥斯卡最佳纪录片金像奖,但是这并不重要。
视频点播能够为纪录片,甚至令人生厌的商业信息片(infomercial)注入新生命。数
字化电视代理人能够编辑在空中传送的电影,就好像大学教授运用不同书本的章节及不同杂
志的文章,编辑文选一样。著作权律师们,系好安全带吧!没有执照的电视台
在网络上,每个人都可以是一个没有执照的电视台。1993年,美国售出了350万部家
用摄像机。虽然家庭自制的录像带终究还赶不上黄金时段电视节目的制作水准(感谢上
帝),但是现在大众媒体的意义已经不限于制作精致的专业水准的电视节目了。
电信管理人员都知道,我们需要宽带来把信号输入家庭,但是他们看不透的是,反方向
的传输也需要同样高容量的频道。互动式电脑服务中的做法把这种不对称状况合理化了:有
时传给你信息时使用的是高带宽,而接收你的信息时使用的则是低带宽。其中的原因是:我
们大多数人打字都比阅读慢得多,而识别图像则比画出图像快得多。
但是,在视频服务中,这种不对称并不存在。频道必须是双向的。举一个明显的例子,
不管是对祖父母还是没有得到子女监护权的离婚父母而言,电信会议未来都将成为绝佳的消
费性媒体。
这是指活的视频信息。想想看“死的”会是什么样。在不久的将来,就像今天经营电子
公告牌的57000名美国人一样,个人也能以同样的方式经营电子视频服务。未来电视的面貌
会逐渐变得像今关的互联网络一样,充斥着小规模的信息制作人。几年后你可以跟朱丽叶.
蔡尔德或某个摩洛哥的家庭主妇学做蒸粗麦粉,也可以和罗伯特.派克(Robertparker)或
法国勃良第的葡萄酒商共同发掘品酒的乐趣。拓朴学的逻辑
目前,信号进入家庭的电子路径有四条:电话、有线电视、卫星电视和空中广播。它们
的差异主要表现在拓扑学意义上,而不是经济模式的交替上。如果我要在相同的时间,把相
同的比特传送给美国大陆的每户人家,我显然应该利用一颗覆盖范围横跨东西海岸的卫星。
这样做最符合拓扑学的逻辑。有些行为,比如说,把比特传送给美国境内22000个电话交换
机中的每一个,就不符合这一逻辑。
相反地,假如我要传送的是地方性新闻或广告,空中广播就是不错的方式,有线电视则
更理想。电话在点对点的情况下,功效最佳。假如要我单纯依据拓扑学的逻辑来决定采用哪
一种媒体,我会用卫星来转播橄榄球超级杯赛,而用电话网络来传送互动式、个人化的“每
周华尔街报道”。我们可以根据某种路径最适合哪一种比持,来决定究竟是通过卫星、空中
广播、有线电视还是电话网络来传输信号。改写距离的意义
但是,在“现实世界”里(许多人总是提醒我这一点,好像我是活在一个不真实的世界
里),每个频道都希望广开财源,因此往往尝试去做自己最不擅长的事情。
比方说,有些同步卫星的经营者想要提供以陆地为基地的点对点网络服务。除非是你提
供服务的地区正试图克服某些特别的地理或政治障碍,例如岛屿地形或新闻审查制度,否则
和有线电话网络的优点相比较,这样做没有多大意义。同样道理,如果要利用空中广播、有
线电视或电话系统等路径把橄榄球超级杯赛的比特同时传送到每家每户,也是非常困难的事
情。
比特终究会慢慢地,在适当的时候,转移到适当的信道上。如果我想看去年的超级杯
赛,利用电话拨号方式来收看,最合乎逻辑(而不是等着看哪家电视台会重播这场比赛)。
赛完之后,超级杯赛一下子变成了档案材料,因此适合的播放信道也就和现场转播(“活”
的资料)时截然不同。
每一种传输信道都有自己的一些反常之处。当你利用卫星把讯息从纽约传送到伦敦的时
候,讯息经过的距离只不过比从纽约用同样办法传到邻近的纽瓦克(Newark)多5英里。
因此,只要位于某个卫星涵盖范围之内,不管你是从麦迪逊大街打电话到同在纽约的公
园大道还是远从纽约时代广场打电话到伦敦闹市区的皮克迪里广场,通话的费用应该相同。
光纤同样迫使我们重新思考传输比特的费用问题。当我们用一条光缆干线在纽约和洛杉
矾之间传输比特时,这种远距离的光缆传输比起用郊区如毛细血管般密布的电话网络传输
来,究竟是更便宜,还是更昂贵,实在很难说。
在数字化世界里,距离的意义越来越小。事实上,互联网络的使用者完全忘记了距离这
回事。在互联网络上,似乎距离还往往起了反作用。与近距离的通信对象相比,我常常更快
地收到远方的回信。由于时差的缘故,远方的朋友可以在我晚上睡觉的时候回信,因此感觉
上反而好像离得更近。
当我们把与互联网络相类似的传输系统用于大众娱乐世界中时,地球就变成了单一的媒
体机器。今天,装了碟形卫星天线的人家已经可以超越地缘政治的界限,欣赏到各种各样的
节目。问题只在于我们应该如何应对这种变化罢了。一网打尽全世界
无论在字面上还是实际运作上,推动变革的都将是互联网络。互联网络之所以吸引人,
不只是因为它是一个遍及全球的大众网络,而且也是因为它是在没有设计师负责规划的情况
下,自然演变而成的,就好像乌合之众般形成了今天的面貌。没有人发号施令,但是到目前
为止,它所有的部分都日渐进步,令人叹赏。
没有人知道到底有多少人使用互联网络,因为,首先,它是一个网络的网络。截止到
1994年10月,互联网络上已经拥有45000个以上的网络,400万个以上的主处理器(每一
季度以超过20%的速度增长),但是这些都不足以用来估计用户的数目。很有可能其中的
一部机器是通往,比如说,法国Minitel网的一个公共网关,因此突然之间,互联网络上又
多了800万个潜在的使用者。
在美国马里兰州(Mary1and)和意大利的波洛尼亚互联网络向所有居民开放,显然这些
人不见得都使用互联网络。但是在1994年,似乎有2000万到3000万人使用互联网络。我
猜想到2000年时,将会有10亿人入网。这种猜测部分的依据是,1994年第三季度互联网
络的主机数增长得最快的国家依次是阿根廷、伊朗、秘鲁、埃及、菲律宾、俄罗斯联邦、斯
洛文尼亚和印度尼西亚。在这3个月中,所有这些国家的增长率都超过100%。我们呢称为
“网络”的互联网络已不再为北美所独享。在互联网络的所有主机中,世界其他地方的主机
占了35%,而这些地方恰恰是增长最快的地方。
3、便捷的联系仅仅数字化是不够的
当你阅读这页文字的时候,你的眼睛和大脑不断把这种印刷媒介转换成你可以当作有意
义的文字来处理和辨识的信号。如果你想把这页内容传真出去,传真机上的扫描仪会绘制出
一幅由一条条线组成的精细的图形,并用0和1分别代表有墨迹和没有墨迹的黑和白。这个
数字化的图形反映原件的逼真程度,完全要视扫描仪的精细度而定。但是,无论你的传真机
扫描得多么精确,传真件最终也只是原件的复制图像罢了,它既不是字母,也不是单词,而
是像素。
如果由电脑来诠释这幅图像的内容,就必须经过一个和人阅读时差不多的识别过程:先
把小块的像素转换成字母,然后再把字母拼成单词,其中还包括了区分字母0和数字0、分
辨出文本内容和手写痕迹、搞清咖啡渍和图解的不同,同时还要在充满噪音(扫描和传输过
程产生的干扰)的背景中明察秋毫。
一旦完成了这个工作,你的数字化文件就不再是一幅图像,而是以字母形式出现、按一
定结构组成的各种数据,通常都按“美国信息互换标准代码”编成二进制码,再加上一些关
于字体和版式的相关数据。传真和ASCII码之间的这种根本差异也存在于其他媒体。
CD是“声音的传真”,它是允许我们压缩、纠错并控制音频信号的数字化数据,但它
不能体现音乐的结构。例如,要在CD中去掉钢琴的声音、替换歌手,或改变交响乐队中乐
器所在的空间位置,就都很困难。8年前,麦克.霍利首先观察到声音传真和结构严谨的音
乐之间存在的巨大差异。他当时还是麻省理工学院的学生,现在刚刚留校任教。他同时也是
一位很有天分的钢琴家。
霍利的博士论文中包括了他在一架特别设计的波桑朵菲大钢琴上所作的研究。这架钢琴
记录下每个琴褪开始敲击的时间,以及琴槌击打琴弦的速度。此外,他把所有的琴键都电动
化,因此,这架钢琴几乎可以毫厘不爽地倒弹一百曲子。这架特殊钢琴就好像一个精心设计
的键盘数字转换器和一架全世界最昂贵和高分辨率的演奏用钢琴的结合体。日本的雅马哈公
司(Yamaha)最近刚刚推出了这种钢琴的廉价机型。
霍利当时考虑的问题是,如何才能在CD上储存超过1小时的音乐。工业上处理这个问
题有两种增量方式。一是把激光从红光改为蓝光,这样缩短了波长(wave1ength),使存储
密度达到原来的4倍。另一种是采用更新的编码技术,因为你的激光唱机用的其实是70年
代中期的算法,从那时到现在,我们已经掌握了更好的声音压缩技术,能比原来至少压缩4
倍(而声音的损失度并不增加)。将这两种技术同时使用,你在一面CD上一下子就能储存
16小时的声音。
有一天,霍利告诉我,他找到了一种办法,可以把好多好多小时的音乐录到一张CD
上。我问:“多少小时?”他说:“差不多5000个小时。”我想,假如这是真的,那么世
界音乐出版人协会一定会雇杀手来取霍利的性命,而他从此以后就要像作家拉什迪一样,为
了逃避杀手永远过着躲躲藏藏的日子。但是不管怎样,我还是请他解释给我听(而且我还和
他拉勾,发誓保守秘密)。
霍利在波桑朵菲钢琴上发现(他找了一个名叫约翰.威廉姆斯的人在这架钢琴上弹奏,
作为他实验的合作者),即使人的手指在钢琴上弹得飞快的时候,在波桑朵菲钢琴上发出的
声音,1分钟也超不过30000个比特。换句话说,测量手指的运动所得到的数据是很低的。
这和CD上每秒120万比特的声音速率相比简直是九牛一毛。也就是说,如果你存储的是手
势而非声音的数据,那你就能多存储5000倍的声音,而且也用不着价值125000美元的波桑
朵菲钢琴,只要有一台价格更低廉的装有乐器数字界面的钢琴就行了。
在CD制造业中,每一个曾经研究过音乐光盘容量的人都胆怯地、也是可以理解地把这
个问题当作只是音频领域的问题,就好像传真完全属于图像领域一样。霍利的想法则恰好相
反,他认为弹奏的手势就如同乐器数字介面,而且两者都更接近美国信息互换标准代码。事
实上,乐谱本身是一种更简洁的音乐表现形式(公认分辨率很低,而且不会因为人的诠释而
产生表现上的差异)。
通过寻找信号中的结构和信号产生的方式,我们已经穿过了比特的表面而进入到它的内
部,发现了图像、声音或文本的基本构件。这是数字化生活中最重要的事实之一。
传真机是一大灾难
假如25年前,计算机科学界对今天电脑能看得懂的新文本比例作一个预测的话,他们
预估的数字可能会高达80%或90%。直到1980年左右,这个预测还是正确的。但紧接着,
传真机冒了出来。
传真机是信息风景线上一个明显的污点,等于向后倒退了一大步,所带来的盘根错节的
影响历久不衰。当然,我谴责的对象是一种似乎为我们做生意的方式,甚至为我们的个人生
活带来了革命性变革的电信媒介。但是,人们并不了解这其中的远期代价、短期失误,以及
其他可行的替代方案。
传真是日本人的遗产,但不单纯是因为日本人很聪明,能够生产出标准化的、比别家更
精良的传真机,就像录像机一样;而是因为日本人的文化、语言和做生意的习惯都有非常形
象化的倾向。
直到10年前,日本人还不是通过文件做生意,而是通过声音,而且通常都是面对面谈
生意。有秘书的生意人寥寥无几,商业函件往往都是辛辛苦苦亲手写成。相当于打字机的东
西看起来更像一部排字机,密密麻麻的铅字模板上有一个电动手臂,要从60000多个字中一
个个挑出需要的汉字符号。
汉字的图形性使传真的发明水到渠成。由于当时电脑能识别的日本文字寥寥无几,因此
采用传真没有什么坏处。但是,对于像英语这种符号式的语言而言,如果考虑到电脑的阅读
能力的话,传真简直就是一大灾难了。
英语只不过使用了26个拉丁字母、10个数字和少量的特殊符号,所以对我们来说,从
8个比特的ASCII码角度来考虑通信的问题,就自然得多了。但传真的存在却使我们忽略了
这一点。举例来说,今天大多数的商业信函都是在文字处理器上拟就的,拟好后打印出来,
再传真出去。想一想这个过程。我们在起草文件时用的完全是电脑可读的形式,而且电脑
“读”得简直太好了,以致于事实上我们常常想不到要用拼写检查程序纠正拼写错误。
接下来我们怎么做呢?我们把它打印在印有单位名称、地址、电话的信纸上,于是,文
件现在完全丧失了数字化的特性。
然后我们把这张纸拿到传真机前,信纸上的内容被重新数字化,变成图像,信纸原来的
质感、颜色、字头等特质经过这一过程而丧失殆尽。这封信被发往一个目的地,也许就是复
印机旁的文件筐里。如果你正好是这个不怎么幸运的收信人,你就拿到这张病怏怏的、纤薄
的、有时好像古代的手卷一般不加剪裁的纸,还得读上面的内容。饶了我吧,这简直就跟把
茶叶传过来传过去一样愚蠢。
即使你的电脑装了传真调制解调器(faxmodem),可以省却打印的步骤,或即使你的传
真机用的是打印用纸,而且可以印出全彩画面,传真仍然不是一种具有智能的媒介。因为,
你把电脑的阅读能力拒之门外,而唯有借助电脑的阅读能力,收信人才能自动储存、检索和
处理你传来的信息。
大约6个月以前,好像某人从某个地方传了一件东西给你……说得好像是“如此这般”
的一件事——这种情况你有几次能想得起来那究竟是一件什么样的事呢?
但假如这封信是以ASCII码形式传送的,你只需要在电脑数据库中搜寻关于“如此这
般”的档案,就可以找到这封信。
当你传真一个电子数据表(spreadsheet)时,你能够传送的只是它的图像而已。但是
如果你采用电子邮递的方式,你等于传了一张可以编辑的电子数据表给收信人,他可以在上
面随意操作、提出问题或以他想用的方式来看这张表。
传真甚至一点也不经济。假如你以9600波特的正常速率传真这页内容,需要花20秒的
时间,大约传输了200000比特的信息。而如果你用电子邮递,不到1/10的比待数就够了:
也就是ASCII码和其他的控制符。换句话说,即使你声称毫不在乎电脑的阅读能力,假如在
同样的9600波特的传输速率的条件下,计算每比特或每秒所要消耗的成本,电子邮递的成
本只有传真的10%(若是在38400波特的速率下,电子邮递的成本更降为传真的2.5
%)。电子邮递急起直追
传真和电子邮递的观念都始于大约100年前。在1994年才首次发现并出版的一份1863
年的手槁《二十世纪的巴黎》中,儒勒.凡尔纳(JulesVerne)写道:“传真电报能将任何
的手稿、签名或图示送到很远的地方,也可以使你与20000公里以外的人签约。电线通进了
每家每户。”
1883年,西部联合电报公司(WesternUnion)推出的自动电报就是一种使用加强型电
线的、点对点的电子邮递系统。今天我们所知道的多点对多点的电子邮递的普遍使用其实早
于传真的普遍使用。60年代中期和晚期,当电子邮递刚刚兴起时,懂电脑的人寥若晨星,
因此,也就难怪80年代传真机一出现,就立刻后来居上。传真的好处是容易使用、轻易就
可以传送图像、复制原件(包括表格)。此外,在某些情况下,而且直到最近,传真上的签
名具有法律效力。
但是到了电脑无所不在的今天,只要看看一飞冲天的电子邮递使用人口,就知道电子邮
递占了压倒的优势。除了数字化的好处之外,和其他媒介相比,电子邮递是一种更具有对话
性的媒介。尽管它不是口语的对话,感觉上却更接近于讲话,而不是书写。
我每天早晨的第一件事就是查看我的电子邮件。稍后我就可以说:“对,我早晨跟某某
人谈过了。”虽然那只是电子邮递。在电子邮递讯息频繁往返的过程中,常常会出现拼写错
误。我记得有一次我因为拼写错误特意向一位日本同行道歉,他回答说,不用担心,因为他
纠正拼写错误的能力一定高于我所能买到的任何拼写检查软件。还真是那样。
这种半对话式的新媒体和写信确实截然不同。电子邮递比快递邮局复杂得多。随着时间
的推移,人们会发现它的各种不同的用途。电子邮递中现在已经出现了一套表情符,例如
用:)代表笑脸。在下一个千年中,电子邮递很可能成为最主要的人际通信媒介,而且在未
来15年中,它将与声音通信并驾齐驱,甚或凌驾于声音通信之上。我们大家都将使用电子
邮递,前提是我们都要懂得一些数字化礼节。网络礼仪
想象一下这样的场景:在18世纪奥地利古堡金碧辉煌的舞厅中,数百支蜡烛摇曳的烛
光、威尼斯式的镜子和华丽的珠宝,把大厅映照得光彩夺目。400名俊男美女在10人管弦
乐队伴奏下,优雅地跳着华尔兹,就好像派拉蒙的电影《一代妖后》或者环球影片公司的
《风流寡妇》(TheMerryWidew)中的场景一样。现在想象一下,场景依然不变,只是其中
390位宾客头一天晚上刚学会跳舞,每个人都小心翼翼地踏着舞步。这跟现在互联网络上的
情形很相似:大多数的使用者都笨手笨脚。
今天,互联网络的用户大多是新手,很多人入网的时间还不满一年。起初,他们会传送
大量的讯息给一小群特定的收信人,不仅内容上长篇大论,而且语气急切,仿佛收信人除了
尽快给他们回信以外,没有更好的事情可做。
更糟的是,通过电子邮递传送文件副本简直易如反掌,而且似乎就跟不花钱一样,对方
只要来一个“回车”,就可以在你的电子信箱中塞满你丝毫不感兴趣的万言书。这个简单的
动作把电子邮递从个人的对话媒介,变成了一种大规模的信息倾销。当你是通过窄带信道联
网时,情况尤其令人沮丧。
一位新闻记者受命撰写一篇关于网络新手及他们率性使用网络的报道。为了研究这个问
题,他没有事先征得我的同意,也没有任何警告,就发了一份长达4页的问卷给我和其他
人。他的报道真可谓是一幅绝佳的自我写照,自己打自己的嘴巴。
简洁是电子邮件的灵魂
对记者而言,电子邮递可以成为最好的媒介。电子邮递采访会较少打扰受访者,也能给
他们更多的思考余地。我相信全世界许许多多的新闻媒体都会把电子采访当成绝佳的媒介和
标准的采访工具——只要记者们能好好学一点数字化的礼节。
要在互联网络上表现使用电子邮递的礼貌,最好的办法就是假定收信人的通信速率只有
1200波特,而且也只有几分钟的时间来读信。反面教材就是在回信的时候,一字不漏地将
原信附上(令人担忧的是许多我认识的网络老手都有这个习惯)。要让电子邮件涵义清楚的
办法不少,这可能是其中最懒惰的一个办法。当信件很长或信道很窄时,更是要命。
另一种极端则更糟糕。例如回信时只答“当然”。什么事情当然啊?
依我的意见,所有数字化习惯中,最糟糕的就是毫无必要地拷贝,也就是动不动就
“cc”(抄送)的习惯。堆积如山的副本令许多企业高级经理人员视上网为畏途。电子副本
的一大问题是,由于回信往往也传送给整个抄送名单,因此副本会自我繁衍,变得越来越
多。你永远不知道某人是偶尔回信给所有人,还是就愿意这么做或不知道该怎么做。假如有
个人正在筹备一个临时的国际会议,邀请我和另外50个人参加,我最不爱看的就是50份行
程安排表以及有关这些安排的琐碎讨论。
“简洁是电子邮件的灵魂”,游吟诗人可能会如是说。星期天也不例外
电子邮递作为一种生活方式,对我们的工作和思考方式都产生了重大的影响。一个具体
的结果是,我们的工作和娱乐节奏改变了。渐渐地,每天早9点到晚5点、每周工作5天、
每年休假2周,将不再是商业生活的主流步调。星期天和星期一不再有那么大的差别。
有些人会说(尤其是欧洲人和日本人),这真是一大灾难。他们宁愿把工作留在办公室
里,不要带回家。人们有远离工作的权利,我当然不会吝惜这一点。但另一方面,我们有些
人就是喜欢随时都被“网罗”,交换条件很简单。就我个人而言,我宁愿以星期天多回复一
些电子邮件,来换取星期一早上的懒觉。既在家中,又在外面
有一幅非常好的、现在也很有名的漫画,描写两条狗在互联网络上对话。其中一条狗在
电脑上打了一行字给它的同伴:“在互联网络上,没有人知道你是一条狗。”它应该再加一
条附注:“而且他们也不知道你在哪里。”
从纽约飞到东京,在大约14个小时的旅程中,我大部分的时间都在打字和撰写四五十
封电子邮件。想想看,假如我一到饭店就把这些邮件交给前台,让其传真出去,一定会被视
为大宗邮件。然而,假如我采用电子邮递,我只要拨一个当地号码,就可以轻松迅速地把事
情办好。而且当我发信的时候,我把这些信直接传递给许多人,而不是发给某个地址;他们
也把讯息传送给我本人,而不是寄给东京某个地方。
电子邮递可以让我们具有超乎寻常的流动性,而且没有人需要知道我们究竟身在何处。
保持联网状态的过程带来了一些有趣的问题,这些问题都和数字化生活中原子和比特的差别
有关,对出差在外的推销员可能影响最大。
我在旅行的时候,至少设法得到两个能让我和互联网络连上的当地电话号码。与一般人
的想象不同的是,这些网络入口都是非常昂贵的商业入口,使我或者可以和当地的报文系统
相连(我在希腊、法国、瑞士和日本的情况就是这样),或者和斯普林特公司及微波通信公
司(MCI)的全球报文服务系统相连。像斯普林特就在俄罗斯的38个城市都有入口号码,这
些号码中的任何一个都能把我和我的单用户分时系统或作为后备力量的媒体实验室主机相
连。一旦与我的分时系统或主机连上,我就在网上了。数字化生活的物理路障
要在世界各地都与网络相连堪称一种法术。问题不在于数字化生存,而在于插头是不是
配备齐全。欧洲有20种(数一数看)不同的电插头!也许你终于已经习惯了小小的塑料电
话插孔,也就是所谓的RJ一11插头,但别忘了世界上还有175种其他插头。我很自豪所有
这些插头中的每一种我至少都拥有一个。因此当我长途巡回旅行时,我的行李箱中1/4的
空间都放满了各式各样的电话插孔和电插头。
但是即使装备完善,你仍然可能连连碰壁,因为许多饭店及几乎所有的电话亭都无法提
供调制解调器的连线端口,这种时候,你可以把一个小小的声音耦合器附着在电话筒上。这
项工作的难易度则要视电话筒上过度设计的程度而定。
一旦连上线之后,即使是通过最古老的、转盘式的模拟电话交换机,比特也能传回家
中,尽管这样有时要求传输系统速度很慢,但纠错能力极强。
欧洲已经开展了一个全欧插头(Europ1ug)计划,以期开发出能满足下列三大目标的单
一电力插头式样:1)样子和目前所有的插头都不同;2)具备目前所有插头的安全性;3)
不会让任何一个国家独占经济上的优势(这一点是欧盟独有的想法)。问题的关键并不仅仅
在于插头。当我们的数字化生活逐渐展开之时,我们会碰到越来越多的物理路障,而不是电
子路障。
比如说,饭店拿掉了RJ一11插孔上小小的塑料夹,这样一来,你就无法把膝上型电脑
的电线插入墙上,这比收取传真接收费还要恶劣。这就是人为破坏数字化的一个例子。扎卡
特夫妇已经允诺要在将来出版的饭店指南中特别说明这种情况,这样数字一族就可以抵制这
类行径卑劣的饭店,另觅佳处来从事他们的数字营生。
4、从游戏中学习学习的乐趣
当麻省理工学院的媒体实验室在1989年首次开展LEGO/logo实验时,汉尼根小学从学
前班到六年级的孩子们在LEGO管理人员、学术界和新闻媒体面前演示实验的成果。一位来
自一家全国性电视网的热切的女主持人在闪亮的镁光灯下逼问一个小孩:这种形式是否不只
是好玩的游戏而已?她想从这个8岁孩子口中逼出一句典型的、机敏的,能够吸引观众的
话。
孩子显然吓呆了。最后,当女主持人连问了三次、镁光灯印热度也越来越高之后,这个
满头大汗、恼羞成怒的小孩直愣愣地看着摄像机说:“对,是很好玩,就是玩起来太费脑子
了。”
西摩尔.派普特(SeymourPapert)正是这种“开动脑筋玩乐”的专家。他很早就注意到
“擅长”语言这种概念很奇怪,因为随便哪个5岁小孩都能在德国学会德语,在意大利学会
意大利语,或在日本学会日语。尽管年纪渐长之后,我们似乎丧失了这种自然学习语言的能
力,但是我们无法否认,小时候我们都曾有过这种能力。
派普特建议当我们把电脑作为一种教育的工具来使用时,可以把它想象成我们在用电脑
创造一个——比如说——叫“数学乐园“(Maih1and)的国家,在那里,孩子们可以像学习
语言那样来学习数学。尽管从地缘政治学的角度,“数学乐园”也许是个奇怪的概念,但在
电脑上却绝对言之成理。事实上,现代电脑模拟技术已经能够创造出“微观世界”
(microworld),孩子们在里面可以在游戏的同时探索极其复杂的原理。
在汉尼根小学LEGO/Logo实验班上,一个6岁的男孩在桌上堆起一堆积本,再把一个
马达放在积木的顶端,然后用两根电线把马达和自己的电脑联上,再在电脑上敲出一个一行
字的程序控制马达的开关。他开动马达的时候,积木跟着震动,于是,他在马达上装了一个
助推器,但由于某种原因(可能是由于操作错误)而装偏了。这次当他再开动马达的时候,
积木震动得更厉害了,它们不但在桌上跳来跳去,而且简直就要给震散架了(为解决这个问
题,他耍了一个骗人的小把戏——这种把戏并不是任何时候都绝对不好——用几根橡皮筋把
积木绑住了)。
随后他注意到,如果他让马达带动助推器顺时针方向转动,那么这堆积木就会先朝右边
扭动然后向任意方向运动。如果他让马达带动助推器逆时针方向转动,则积木会先向左扭动
然后再向任意方向运动。最后,他决走在积木的下面装上几节光电池,然后把积木放在他在
一张大自纸上潦草画出的黑线上。
他在电脑上设计了一个更复杂的程序,然后启动马达。看到黑线,光电池会让马达停下
来,再重新启动,如果重新启动时马达顺时针转,则积木右扭,反时针转,则积木左扭,终
究又回到黑线上。结果是他造出了一堆会动的积木,沿着那条潦草的黑线而扭动前进。
这孩子成了英雄,老师和同学们都想知道他是怎样发明出这种装置的,并且从许多不同
的角度来分析他的实验,向他提出各种问题。这个小小的莱耀时刻使他体会到了一种非常重
要的东西:学习的乐趣。病人豪膏的年轻人
在我们的社会中,有学习障碍的学生可能远没有我们想象得那么多,倒是有障碍的教学
环境之多远远超出了我们的想象。电脑能令这一切改观,因为它能帮助我们更好地了解学习
和认知类型截然不同的孩子。
大多数的美国孩子都不知道波罗的海国家和巴尔于半岛国家有什么不同,谁是西哥特人
(Visigoth,日耳曼族的一支),或路易十四生活在哪个年代。那又怎么样呢?为什么这些
事情就这么重要呢?你知道里诺(Reno)是在洛杉矾的西边还是东边吗?
法国、韩国和日本这些国家不断在青少年的头脑中灌输各种知识,它们付出的高昂代价
就是,当这些年轻人升入大学的时候,他们已经跟死人差不多了。之后的4年,他们觉得自
己就好像刚刚跑完马拉松只剩下一口气时却还被逼着参加攀岩一样。
60年代,大多数电脑和教育的先驱都提倡一种拙劣的不断演练的教学法,把电脑用在
一对一的教学上,由使用者自己控制进度,从而更有效地教授同一堆吓人的知识。现在,多
媒体风行一时,又出现了一批闭问造车,笃信练习好处的人,他们自认可以把电子游戏的魔
力移植到教育上,以更高的效率向孩子们的头脑里灌输更多的信息。
1970年4月11日,派普特在麻省理工学院举办了一个题为“教会孩子思考”的研讨
会。他在会上提议把电脑用作发动机,使孩子通过使用电脑而学会教导别人,并从教导别人
之中学习。差不多有15年的时间,这个极其简单的念头一直在他的脑海中盘旋,但直到个
人电脑问世,它才终于付诸实现。今天,当1/3的美国家庭都拥有了个人电脑时,它大展
身手的时刻才真正来临。
学习中很重要的一部分当然是来自教——但必须有好的教师和好的教学方法,其中一个
主要的衡量标准是教育能否引导孩子探索未知、掌握学习的方法,并找到前进的方向。在电
脑出现以前,教学手段局限在运用视听设备和通过电视进行远程教学上,这些方式只不过更
强化了教师的主动性和学生的被动性。自己动手做一只青娃
电脑大大地改变了这种状态,忽然之间,从动手做事中学习变成了一种原则,而不是特
例。由于我们现在几乎可以用电脑来模拟任何事物,我们不再需要靠解剖青蛙来了解青蛙的
构造。相反地,我们可以让孩子们自己设计青蛙,创造出一种行为类似青蛙的动物,修正它
的行为,模拟它的肌肉,在这只模拟青蛙身上玩不同的游戏。
游戏于信息中,尤其是游戏于抽象的主题中的时候,信息载体呈现了更丰富的内涵。我
还记得我儿子三年级的时候,老师难过地告诉我,他不会算两位或三位数的加减法。我想,
这真是奇怪,我们在家玩大富翁游戏的时候,他老是当银行家,他看起来对与数字打交道很
有一套。
所以,我建议老师在出加法运算题时,试着不要把题目中的数字当作单纯的数字,而把
它们转化成钱数。你瞧,他突然就开窍了,有办法心算出三位数的加减法,甚至更高位数的
也不在话下。原因是,这堆原本抽象而没有意义的数字,现在都变成了钱,可以用来买路,
建旅馆和付过路费。
电脑控制的LEGO则更进一步,让孩子们能够赋予物理构造以行为能力。目前媒体实验
室的LEGO研究还包括在一个积木中植入电脑的原型,为派普特的结构主义展现了更多的弹
性和机会,同时还包括了积木与积木之间的通信,以及以新的方式探索并行处理的研究。
今天,利用LEGO/Logo的孩子会学到你我在大学里才能学到的物理和逻辑原理。许多
有趣的证据和谨慎的测试结果都表明,这种结构主义的方法是适合不同认知和行为风格的丰
富的学习手段。事实上,许多被认为有学习障碍的孩子,在这种结构主义的学习环境中,都
能健康成长。信息高速路上的顽童
当我还在瑞士的寄宿学校就读时,因为离家太远,我和其他一些孩子在放秋假时没法回
家,但却可以参加一场疯狂的寻宝比赛。
学校的校长是一位瑞士将军(他和大多数的瑞士军人一样,属于预备役),他既谋略过
人又有号召力。他安排了一个为期5天、周游全国的竞赛,把孩子们分成小队,每个小队有
4个从12岁到16岁不等的孩子,一共发给100瑞士法郎(当时合23.5美元)和1张为期
5天的铁路乘车证。
每个小队都拿到不同的线索,然后就出去周游各地,沿路只要完成任务就可以得分。你
可不要小看了这场比赛。有时候,我们得在半夜赶到某个特定经度和纬度的位置上,一架直
升飞机会从天而降,丢下一个1/4英寸、缠成一团的录音带,用乌尔都语给我们下达下一
个任务:想办法逮住一头活猪,把它带到某个指定地点,在那里,我们会拿到一个电话号码
(要找出这个电话号码,我们又得先解开一个复杂的号码谜,谜题是7个冷僻事件发生的日
期,把这7个日期中每一个的最后一个数字拼在一起,就是我们要拨的电话号码)。
这类的挑战对我总是有莫大的吸引力,而且,恕我在此自卖自夸,我的小队赢了这场比
赛——我一直相信我们会赢。由于那次经历给我的印象太深了,我在儿子14岁生日那天,
也为他做了同样的安排。由于没有美国军队可以听我调遣,我只为儿子和他班上的其他同学
安排了一天的波士顿探险,同样把他们分成小队,只准他们随身带着固定数目的钱和一张不
受限制的地铁车票。我花了几个星期的时间来安排各种线索:跟饭店的前厅接待员打招呼、
把线索藏在公园的长椅下,有些地点则必须靠解开电话号码的谜题才能找到。你或许也能猜
到,在学校功课拔尖的孩子不见得会赢——事实上,情况往往相反。街头顽童和“聪明”学
生之间,总是有很大的差别。
举例来说,在我安排的寻宝比赛中,有一次必须解开一个填字游戏,才有办法找到其中
一个线索。一般的聪明学生会冲进图书馆找资料,或打电话向他们的聪明朋友请教。街头顽
童则在地铁里到处询问路人,结果,他们不但更快找到答案,而且他们一面询问,一面从A
点移到B点,行进了较多的距离,也在比赛中拿到了较多的分数。
今天的孩子有机会在互联网络上做一个街头顽童。在网络上,“孩子们能够听到彼此的
声音但却看不到对方”。具有讽刺意味的是,在网络上,读和写两项技能大有好处。孩子们
靠读和写来沟通,而不只是完成一些抽象的和模拟的游戏。不要把我所提倡的东西曲解为反
对发展智力或蔑视抽象推理,恰好相反,互联网络给人们提供了探索知识和意义的新媒介。
网络上的寻宝比赛
我有轻微的失眠症,经常在凌晨3点钟醒来,然后在电脑上消磨一个小时,再回去睡
觉。有一次我正在电脑前昏昏欲睡的时候,收到了一个叫迈克尔.施瑞格的人给我发来的电
子邮件。发件人彬彬有礼地自我介绍,他是个中学二年级学生,想知道那个星期晚些时候他
来麻省理工学院时,能否顺道拜访一下媒体实验室。我建议他来旁听我星期五的“比特就是
比特”这门课,还为他指派了一个学生向导。我同时也把我们之间的通信各复印了一份给另
外两位同事,他们也都同意和他见面。可笑的是,他们误以为他是著名的专栏作家迈克尔.
施瑞吉,其实施瑞吉的名字后面多了一个e。
当我终于和施瑞格碰面的时候,他的父亲陪着他。他父亲向我解释说,施瑞格在互联网
络上认识了各种各样的人,而且施瑞格眼中的互联网络就好像我眼中的寻宝比赛一样。最令
施瑞格的父亲惊讶的是,不管这些人是诺贝尔奖得主也好,企业高级管理人员也好,似乎都
能抽出空来,回答施瑞格的问题。原因是,在电脑上回信实在太容易了,而且(至少目前为
止),大多数人还没有被一大堆无缘无故的电子邮件所淹没。
长此以往,能够在互联网络上投入时间与智慧的人将会越来越多,互联网络也将变成一
个人类交流知识与互助的网络。例如,美国退休人员协会的3000万会员身上就汇集了许多
尚未被开发的集体经验。只要敲几下键盘,如此丰富的知识与智慧就能力年轻人所用。代沟
在顷刻问便被大大缩小了。
5、无所不在的万事通机器的哀求
如果你打算雇人为你做饭、扫除、开车、烧火、守门,你能要求他们互不讲话、不去注
意别人都在做什么、也不去协调彼此的职能吗?
可是,当我们用机器来执行这些职能时,我们却能胸有成竹地把它们一一分开。现在,
我们的真空吸尘器,汽车,门铃,冰箱,热力系统都还是封闭式的专用系统。设计师在设计
的时候,并没有打算让它们互相交流。在协调机器的行为方面,我们走得最远的一步,就是
在许多器具中都装上了数字钟。我们试图利用数字时间,使某些功能同步进行,但结果却多
半是造就了一堆呜咽的机器,上面不停闪动的“12:00”仿佛在低位:“求求你,想办法让
我变得更聪明一点吧!”
机器必须能轻松地彼此交谈,才能为人提供更好的服务。寻找同伴的呼唤
数字化改变了机器与机器交流标准的特点。过去,人们习惯于聚在日内瓦或其他地方开
国际会议,一槌敲定(这是工业化的年代里一个颇能说明问题的比喻)从频谱分配到电信协
议等一切事物的世界标准。有时,这个过程旷日持久,例如由于对综合服务数字网(1SDN,
integratedservicesdigita1network)的电话标准讨论太久,等到标准通过时,技术已经落
伍了。
标准制定委员会的操作前提和心态是,电子信号就好像螺纹一样。为了让螺钉和螺帽能
适用于不同的国家,我们必须在每一个关键尺寸上都达成一致,而不是只制定部分标准。即
使你算好了每英寸或每公分该有多少螺纹,假如直径不对,螺钉和螺帽仍然无法配套。机械
世界在这方面的要求是很苛刻的。
比特就宽容多了。比特很适合更高级的语言描述和“协议”(protocol,原意为“礼
仪”,过去专指上流社会在社交上的繁文褥节)。有些协议可以具体到规定两部机器如何
“握手”。“握手”(handsha-king)这个词,实际上是个技术术语,指两部机器之间如何
建立通信,并且决定在通话中使用哪些变数。
下次你使用传真或调制解调器时注意听听看。所有那些杂音和难听的哗哗声,实际上都
是在进行机器之间的联系交换。这些寻找同伴的呼唤声,就是在想办法商讨出所有变数中的
最大公分母,以便找出交换比特的最广范围。
在更高的层次上,我们可以把通信协议当作中间标准,或是用来商讨出更具体的比特交
换方式的语言。在使用多种语言的瑞士,假如你一个人去滑雪,而和陌生人共同搭乘滑雪缆
车,这时你想和同伴交谈的话,第一件事一定是先商量用哪一种语言来沟通。电视和烤箱在
携手合作以前,也会先间彼此同样的问题。会动的小东西
25年前,我应邀参加了一个顾问委员会,审核通用产品代码(UPC,
universalproductcode)的最后设计。通用产品代码是电脑可以识别的小小条形码,现在几
乎随处可见,也就是当年令布什总统大出洋相的那个东西。话说某次,布什看到超级市场的
自动结帐收银机时,表现得十分惊讶,因此被引为笑谈。现在除了新鲜蔬菜以外,从罐头、
包装盒到书籍(虽然有点破坏书籍装帧的效果),几乎所有商品上都使用条形码。
这个通用产品代码顾问委员会的任务,就是对最后的条码设计签字画押。在评估进入了
最后一轮的几个设计(小圆窗形的设计最后被评为亚军)后,我们也讨论了几个疯狂但有趣
的提议,例如让所有的食品都带一点放射性,放射性的大小依成本而定,于是每个结帐柜台
都变成了盖革计数器(Geigercounter,一种放射能测定器),而购物者则根据自己购物车
中的拉德(辐射吸收剂量单位)数值而付款。(据估计,一罐普通菠菜会让你暴露在每小时
每公斤1/10微拉德之下,和人体从食物中获取的10万焦耳的化学能量比较起来,这只不
过是每小时十亿分之一焦耳罢了。也许这就是为什么大力水手卜派要把菠菜吃进肚子里,力
气才会变得比较大。)
这个疯狂的点子却蕴含了一点小小的智慧:我们何不让每个upc条码也能放射数据呢?
或者,为什么不让它也能够有活性、可以像幼儿园的孩子一样举手发言呢?
我们做不到这一点的原因是它要消耗能量,因此条形码和其他“名字标牌”就被做成没
有反应能力的东西。不过事实上,这个问题不是没有办法解决,例如可以从光中获得能量,
或动用很少的能量来延长电池的使用年限。当在小范围内使用这些办法时,所有的“物品”
就都可以呈现数字化的活化反应。比如说,你屋子里的每个茶杯、每件衣服、(对了,还
有)每本书都能说出自己的位置。将来,“遗失”将和“绝版”一样,根本不可能发生在现
实生活中。
活性标签将在未来扮演重要的角色,因为它们将把非电动化、没有生命的小东西(如玩
具熊、螺旋钳、水果盘等)引进数字化的世界。不久之后,人类和动物都将把活性标签像徽
章一样戴在身上。还有什么圣诞礼物比活性的宠物项圈更好呢?从此,你再也不用担心你的
小狗或小猫走失了(或者,更准确的说法是,它们可能会走失,但你会知道它们在哪儿)。
人们已经为了安全的缘故戴上了活性徽章。好利获得公司英国分公司正在开发一种新产
品。戴上这种徽章以后,不管你在一幢建筑物中的任何地方,它都能知道你的位置。如果有
人打电话找你,离你最近的电话就会响起铃声。将来,你不必把这类装置(用夹子或别针)
别在衣服上,这类装置会万无一失地织进你的衣服中,或粘在衣服上。把电脑穿戴在身上未
来数字化服装的质料可能是有计算能力的灯芯绒、有记忆能力的平纹细纱布和太阳能丝绸,
我不必再携带膝上型电脑,而是把它穿在身上。尽管听起来不可思议,我们其实早已开始把
越来越多的计算和通信设备穿戴在身上了。
手表就是其中最明显的例子。它肯定会从今天单纯的时钟而摇身一变为明天移动的指挥
控制中心。戴手表是一件再自然不过的事情,很多人就连睡觉的时候也戴着它。
一体化的、戴在手腕上的电视、电脑和电话,将不再是狄克.特雷西、蝙蝠侠、或科克
船长的专利。在未来5年中,这种可以穿戴的装置可能会成为消费品中增长最快的部分。
“天美时”(Timex)现在已经在手表和个人电脑之间提供无线电通信了。它生产的这种手
表预计会非常火爆,到时候,许多微软的系统中都将吸收这种聪明的(光学)传输软件。
我们给这些小装置提供动力的能力,很快就会赶不上电脑微型化的速度。在技术领域
里,动力的进步简直就如龟步般缓慢。如果电池技术的进步能像集成电路的发展那么快的
话,我们早就可以开着由镁光灯电池发动的汽车去上班了。恰恰相反,长途飞行时我得背着
超过10磅重的电池才能让我的膝上型电脑不致有断炊之虞。经过一段时间的演变,由于笔
记本型电脑具备了更多的功能和更好的显示器,膝上型电脑所用的电池也就越来越重了。
(1979年,索尼公司推出的最早的膝上型电脑Typecorder只用4节AA型电池。)
在可穿戴的电脑上,很可能会出现一些富于想象力的动力问题解决办法。阿贝克隆比和
费奇公司已经推出一种旅行帽,上面有一个以太阳能电池为动力的小电扇,会把风吹到你的
前额上。另外一个可以存储动力的绝佳所在,就是你的腰带。把腰带拿下来,看看它占据了
多大的面积和体积。设想一下,如果把皮带扣设计成可以插到墙上、为移动电话充电的设
备,那该有多好!
至于天线(antenna)的问题,人体本身就可以变成天线的一部分。而且,大多数天线
形状的特点使它们很适合织进布料之中,或是当作领带一样戴着。只要加上一点点数字化的
帮助,我们的耳朵就能够像兔子耳朵般灵敏。
重要的是要认清,将来会有许多数字化装置,无论其形状和大小,都和我们目前所能联
想到的大不相同。经营电脑设备零售业的可能不止无线电器材公司(RadioShack)和
siap1es公司这类传统电子商店,且还包括销售耐克(Nike)运动器材、利维牛仔裤或香蕉
共和国(BananaRepublic)服饰的商店。在更远的将来,电脑显示器可能会按加仑来卖,而
且漆成五颜六色。光盘只读存储器可以食用,而并行处理器则可以像防晒油般涂在身上。偶
尔,我们还可以住在电脑里面。无所不在的电脑化
由于我是学建筑出身,我发现许多很有价值的建筑学概念都直接适用于电脑设计上。但
是反过来,电脑设计除了让我们的环境中充满了各种看得见和看不见的智能装置外,对建筑
学却几乎没有多少帮助。到目前为止,把建筑物想成巨大的机械电子装置,并没有激发出什
么在建筑学上有创意的应用。
未来的建筑将像电脑底板(backplane)一样“智慧随时待命”(smartready,这个词
是AMP公司在推出它的“智慧型房屋”计划时创造的)。“智慧随时待命”也就是为未来电
器之间的信号共享而预设线路和遍布连接器。例如,你可以加上各种处理器,让你的起居室
呈现和卡内基音乐堂一样的音响效果。
我所见到的“智慧型环境”大都不能感应人类的存在。这是个人电脑不断升级过程中所
面临的问题:环境没有办法看到你,或感觉到你的存在。就连恒温器都是根据墙面的温度,
而不是你感觉冷还是热,来调节温度的。将来的房间会知道你是刚刚坐下来吃饭、已经睡着
了、刚进浴室洗澡,还是出去遛狗了。这样的时候,电话铃不会响。如果你不在家,它也不
会响。如果你在家,而且你的数字化管家决定把电话给你接过来的话,离你最近的门把手会
先说声“对不起,夫人,”然后把电话接进来。
有些人把这种情形称为“无所不在的电脑化”。的确如此。有些人则认为这和使用代理
人界面背道而驰。其实不然。这两个观念根本就如出一辙。
目前我们生活中各种互不相连的电脑处理流程(民航订位系统、销售点数据、各种网上
服务、电子计量、讯息传递等)将促使个人电脑无所不在。所有的处理流程也会越来越多地
互联起来。假如你飞往达拉斯的早班飞机延迟起飞了,你的闹钟就会晚一点响,而且车辆服
务部门也会自动收到交通预报。
现在大多数关于未来家庭的描绘中,都看不到家用机器人的身影:这是个奇怪的转变,
因为20字前,几乎所有关于未来的描写中都有机器人。其实,C3PO机器人会是个狐狐叫的
管家,就连它的口音都再合适不过了。
人们对家用机器人的热情会再度点燃,我们可以期待未来的数字化佣人用腿脚来爬楼
梯、用臂肘来掸灰、用双手来端饮料。由于安全上的原因,家用机器人也将能像凶猛的看家
狗一样狂吠。这些都不是新观念,技术也几乎已经成熟了。全世界可能有10万人都愿付10
万美金来买一个这样的机器人,这样一个价值百亿美金的大市场将不会被冷落太久。聪明的
汽车
在一辆现代的汽车上,电子的成本已经超过了钢铁。现在的汽车里已经有50多种微处
理器。这并不表明我们把这些微处理器全都用得很高明了。你租了一辆时髦的欧洲轿车,可
是直到加入了加油站前排起的长龙时,才发现自己不知道怎样用电子方式打开油箱,这岂不
丢人现眼!
汽车中的主要数字化装置将包括智能无线电、能源控制和信息显示器。除此之外,汽车
还可以享受到另外一个数字化技术的特别好处:它们将能够知道自己的位置。
由于近来地图绘制和跟踪技术的发展,我们可以面对一个描绘所有道路的电脑模型,找
出汽车目前的方位。美国境内所有的道路位置都可以记录在一张光盘上。通过卫星、双曲线
远程导航系统、加上计算汽车不断加快的速度,或将这些跟踪技术综合运用,就可以找出汽
车的方位,误差不过几英尺而已。大多数人都记得在007情报员詹姆斯.邦德驾驶的轿车
中,在他和驾驶副座之间的仪表板上有一个电脑显示系统,会呈现出一幅地图,显示他当前
的位置和目的地的方向。这种电脑显示系统现在已经成为被人们广为接受和使用的商品了。
在美国,奥斯摩比汽车首先在1994年采用了这种装置。
但是,有一个小问题。很多开车的人都无法在快速前进的汽车中让眼睛迅速重新对焦以
看清电脑显示器上的内容,老年人尤其如此。对他们来说,要从注视远方,突然变为注视离
自己只有2英尺远的物体(而且反复做这种转换),是很困难的事情。更糟的是,有些人得
戴着眼镜才能看地图,十足是马古先生驾车。因此,声音才是更好的协助导航的方式。
既然你在开车的时候根本用不上耳朵,耳朵就成为理想的信息通道,告诉你什么时候该
转弯,该找什么标志,假如你看到什么什么东西,就表示你开过了头。但是,如何精确地表
示方向是个很大的挑战(因为它很困难,所以人类在这方面表现得一塌糊涂)。道路上充满
了模糊的指令。当你距离路牌几百英尺或几百码以外时,“下一出口右转”的指示非常清
楚,但是,当你已经开到路牌附近时,到底“下一出口”指的就是眼前这一出口还是再下一
个出口呢?
尽管要制造出这种数字式的、能说话的、优良的“后座驾驶员”不是没有可能,我们却
不太可能在美国市场上很快见到这种产品。相反,你将看到的是和邦德的汽车上一模一样的
装置,无论应该还是不应该,安全还是不安全。其中的原因很荒谬:假如汽车能够对你说
话,而它提供的地图数据是错的,以至于你开进一条没有出口的单行线而发生车祸,责任应
该由谁来负?而反过来,如果你是因为自己看了地图以后而发生意外,就只能怪自己运气不
好了。在欧洲,人们对于赔偿和诉讼的看法比较开明,因此梅塞德斯——奔驰汽车
(Mercedes一Benz)今年将推出会说话的导航系统。
这种导航系统的功能将不只限于把你从A点引导到B点,它将还能提供有声导游(“你
右侧的这个建筑是……的出生地”)和有关食宿的信息(已经在第3个出口附近给你订了一
家很棒的旅馆。)新的相应的专门市场将会出现。事实上,如果将来你的智能汽车被盗,它
还可以打电话给你,告诉你它的确切位置。或许它的声音听起来还好像吓坏了的样子。
6、新电子表现主义穿过时空隧道的医生和教师
在冰箱上张贴小孩涂鸦的作品和苹果派一样,代表了道地的美式作风。我们鼓励孩子表
现自我,自己动手做东西。可是,等到他们6岁大的时候,我们却突然改弦易辙,让他们觉
得美术课就像棒球课外活动一样,比不上英文或数学那么重要,有志出人头地的年轻人应该
把时间花在阅读、背诵和复习上。于是,在他们上学以后的20年里我们像填鸭一样拼命往
他们的左脑中灌输各种知识,却让他们的右脑日渐萎缩。
派普特曾经讲过一个故事。一位19世纪中叶的外科医生神奇地穿过时光隧道来到一间
现代的手术室。所有的一切对他而言都全然陌生。他不认识任何手术器械,不知道该怎样动
手术,也不知道怎样才能帮得上忙。现代科技已经完全改变了外科医学的面貌。
但是,假如有一位19世纪的教师也搭乘同一部时光机器来到了现代的教室,那么,除
了课程内容有一些细枝未节的变动外,他/她可以立刻从他/她的20世纪末的同行那里接
手教起。我们今天的教学方式和150年前相比,几乎没有什么根本的改变,在技术手段的运
用上,也差不多还停留在同样的水平。事实上,根据美国教育部最近所作的调查,84%的美
国教师认为只有一种信息科技是绝对必要的:复印机再加上充足的复印纸。更好的调色板
然而,我们终究开始摆脱这种呆板僵化的教学模式,从主要迎合那些约束自己按部就班
的孩子,走向更多元化的教学。在这种教学中,艺术与科学之间、左脑与右脑之间,不再径
渭分明。当一个孩子使用Logo这样的计算机语言,在电脑屏幕上画图时,所画出的图形就
既是艺术的,也是数学的,可以看作两者中任意一种。即使抽象的数学概念现在都可以借助
视觉艺术的具体形象来加以阐释。
个人电脑将使未来的成年人数学能力更强,同时也更有艺术修养。10年后的青少年将
拥有更丰富多样的选择天地,因为不是只有书呆子才能成就高深的学问,具有各种不同的认
知风格、学习方法和表现行为的人,都可能成大器。
工作与游戏之间的中间地带会变得异常宽广。由于数字化的缘故,爱与责任不再那样界
线分明。业余画家大量涌现,象征着一个充满机会的新时代的来临,以及社会对创造性休闲
活动的尊重。未来将是个终身创造、制造与表现的年代。今天,当退休的老人重拾画笔时,
他仿佛又回到了孩提时代,但和青壮年时期相比,他所得到的完全是另外一种回报,将来,
不同年龄的人都会发现自己的生命历程更加和谐,因为工作的工具和娱乐的工具将越来越合
二为一。将有一块更好的调色板来谐调爱与责任、自我表达与团体合作。
老老少少的计算机黑客们就是最好的例子。他们设计的程序就好像超现实主义的绘画一
样,既有高度的美感,又有卓越的技术。我们可以同时从风格与内容、意义和表现手法等不
同层面,来讨论他们的作品。他们的电脑程序表现了一种新美学。这些黑客们正是新电子表
现主义的先驱。音乐的推动力
事实证明,音乐是计算机科学形成过程中最重要的推动力之一。
我们可以从三个非常有力而又相互补充的方面来探讨音乐问题。首先是数字信号的处理
——比方说极难解决的声音分隔问题(例如在录下的音乐中抹去可乐罐落地的杂音)。我们
也可以从音乐的认知角度进行探讨——如何诠释音乐语言,音乐欣赏的构成要素有哪些,情
绪从何而来?最后,我们可以把音乐当成一种艺术表现和叙事手段——叙述一个故事,激发
一些情感。所有这三个方面当仁不让,都非常重要,它们使音乐成为完美的知性领域,让我
们能优雅地穿行于技术与表现、科学与艺术、个人世界与公众世界之间。
假如你问挤满整个礼堂的计算机系学生,他们当中有多少人会乐器,或有多少人认为自
己爱好音乐,绝大多数人都会举起手来。数学和音乐之间传统的亲密关系现在惊人地表现在
计算机科学界和电脑黑客群体之中。媒体实验室由于研究音乐而吸引了一批出类拔萃的计算
机系学生。
美术和音乐这种儿时的嗜好,能够让孩子以全面的眼光来观察和探索迄今为止还是以单
一方式呈现在他们面前的浩瀚的知识世界。但是父母和社会往往有意无意地阻挠孩子发展这
方面的兴趣,或让孩子只把美术和音乐当成学业攀登中缓解压力的手段。我上学时很讨厌历
史课,但却能说出美术和建筑史上所有重要的里程碑和它们的年代,而对政治事件和战争的
年代我却怎么也记不住。儿子受我的遗传,也有诵读障碍,但却能津津有味地把有关高空冲
浪和滑雪的杂志一字不落地看完。对有些人而言,音乐可能正是研究数学、学习物理和了解
人类学的最佳途径。
说完了上面这些,转过头来,我们究竟如何学习音乐呢?整个19世纪和20世纪的初
叶,在学校练习乐器是很普遍的现象。后来,录音技术的发展阻止了这一潮流。直到最近,
才有些学校重新让学生从制作音乐中来学习音乐,而不只是靠听音乐来学习。让幼小的孩子
利用电脑学习音乐有很大的好处,因为电脑能提供五花八门的入门途径。电脑不会限制有天
分的孩子接触音乐的机会。孩子可以借助各种不同的方式,通过电脑来体验音乐,音乐游
戏、声音数据磁带和本身可控制的数字声音,只是其中的几个例子而已。视觉感奇佳的孩
子,甚至还会希望发明出看见音乐的方法。电子艺术
电脑和艺术第一次碰面时,会给双方都带来恶果。其中一个原因是机器的印记太强烈
了,在全息艺术或立体电影中,电脑的表现往往压过了艺术原来意欲表达的内涵。科技就好
像法国调料酱中的胡椒一样,电脑味道太强的结果,反而喧宾夺主,掩盖了艺术表现中最微
妙的信号。
毫不奇怪,在音乐和表演艺术中,电脑和艺术表现得最为相得益彰。因为在这两个领域
中,艺术作品的表现、传播和体验都能在技术上很容易地融合在一起。作曲家、表演者和观
众都可以进行数字控制,如果荷比.汉考克(HerbieHancock)在互联网络上推出他的下一部
作品,那就好比在一个拥有2000万个座位的剧场中演奏,而且每位听众都可以根据自己的
情况改变音乐的表现。对有些人而言,只要单纯调节音量就可以了。有些人则可能把音乐转
换成卡拉OK。其他人甚至会调整它的酬。
数字化高速公路将使“已经完成、不可更改的艺术作品”的说法成为过去时。给蒙娜.
丽莎(MonaLisa)脸上画胡子只不过是孩童的游戏罢了。在互联网络上,我们将能看到许多
人在“据说已经完成”的各种作品上,进行各种数字化操作,将作品改头换面,而且,这不
尽然是坏事。
我们已经进入了一个艺术表现方式得以更生动和更具参与性的新时代,我们将有机会以
截然不同的方式,来传播和体验丰富的感官信号。这种新方式不同于读一页书,也比到卢浮
宫(Louvre)实地游览更容易做到。互联网络将成为全世界艺术家展示作品的全球最大的美
术馆,同时也是直接把艺术作品传播给人们的最佳工具。
当数字化艺术家提供了改编作品的手段时,他们同时也开创了数字化艺术发展的大好契
机。尽管这种做法似乎把重要的艺术作品全然世俗化了——就好像把斯泰肯的所有照片都印
到明信片上,或是把瓦霍尔(AndyWarho1,1928一1987)的所有作品都变成装饰艺术一
样。关键是,数字化使我们得以传达艺术形成的过程,而不只是展现最后的成品。这一过程
可能是单一心灵的迷狂幻想、许多人的集体想象或是革命团体的共同梦想。离经叛道者的沙
龙
媒体实验室最初的想法是把人性化界面和人工智能的研究,带往新的方向。这种新的方
向是指通过信息系统的内容、消费性应用的需求和艺术思维的本质来塑造人性化界面和人工
智能。我们向广播电视、出版和电脑界大力推销这一想法,因为它将影像的感官丰富性。出
版的信息深度,以及电脑的内在互动性集于一炉。这个概念今天听起来十分合乎逻辑,但当
时在众人眼中却愚不可及。根据《纽约时报》的报道,麻省理工学院一位不愿透露姓名的资
深教授认为,所有和这个项目有关的人都是“江湖骗子”。
媒体实验室坐落在一栋由著名建筑师贝律铭所设计的建筑中(设计时间是在华盛顿国家
美术馆的延伸建筑之后,以及在巴黎卢浮宫的金字塔之前)。我们花了7年左右的时间来筹
募财源、修建大楼和延揽人才。
就像1863年巴黎艺术界的当权派拒绝让印象派画家参与正式的美术展一样,媒体实验
室的这群被正统人士拒之门外的始创研究人员也就自立门户,成立了自己的“落选者沙龙”
这些人中有些在学术界眼中太过激进,有些人的研究不见容于自己的系所,有些人则根本无
处容身。除了魏思纳和我以外,这一群人还包括了一位电影制作人,一位图形设计师、一位
作曲家、一位物理学家、两位数学家,和一群在这之前的几年中发明了多媒体的研究人员。
我们在80年代初聚集到一起,形成了电脑科学界的一支非主流文化。当时的电脑界仍
然是程序设计语言、操作系统、网络通信协议和系统结构的天下。维系我们的并不是共同的
学术背景,而是一致的信念:我们都相信,随着电脑日益普及而变得无所不在,它将戏剧性
地改变和影响我们的生活品质,不但会改变科学发展的面貌,而且还会影。胜活的每一个方
面。
我们这群人的结合可谓占尽天时,因为当时,个人电脑已经诞生,用户界面开始受到重
视,电信工业也解除了管制。报纸、杂志、书籍、电影厂和电视台的拥有者和经营者都开始
自问:未来将以何种面貌出现。两位聪明的媒介巨孽,时代——华纳的史蒂夫.罗斯和迪克.
门罗凭直觉预见到数字化时代的来临。而投资麻省理工学院的一个疯狂的新项目…对他们来
说,用不着下多大的本钱。于是,我们很快就发展成一个拥有300人的研究机构。
今天,媒体实验室已经成为主流,而互联网络上的冲阶浪手则成了在街头游荡的疯孩
子。数字一族的行动已经超越了多媒体,正逐渐创造出上种真正的生活方式,而不仅仅是知
识分子的故作姿态,这些网上好手结缘于电脑空间。他们自称为比特族或电脑族,他们的社
交圈于是整个地球。今天,他们才代表了落选者沙龙,但他们聚会的地方不是巴黎的咖啡
厅,也不是位于坎布里奇的贝律幸铭建筑。他们的沙龙是在“网”上的某个地方。
这就是数字化生存。
新时代书城
| 本站申明:本站是一个公益的,非盈利的网站,本站作品收集于互联网,版权均为原创者所有,任何人不得用于商业用途。强烈要求各位支持您喜爱的作者,踊跃购买他们的正式出版物!,如有作者或出版社认为本站侵权或有任何异议,请告知我们,立即删除,谢谢! QQ:983229736 |