有一种精神 Archive

标签时代(四)

Posted 2008/01/22 By Andy

完。

 

 

Sent to you by Anting Xu via Google Reader:

 

 

标签时代(四)

via 木遥的窗子 by 木遥 on 1/20/08

1864年5月的一个晚上,几位英国政治家被连夜敲门送到的一份电报惊动——这么晚的电报委实不太寻常。战争爆发了么?女王生病了么?他们撕开了信封,结果惊讶的发现电报的内容不是关于任何国家事务,而是关于牙医的。Harley街27号的Messrs Gabriel先生在电报里宣布他的诊所会从早上十点开到下午五点,直到十月份为止。几位被激怒的政治家向泰晤士报写信咆哮他们的不满。"我从来不认识这个Messrs Gabriel,我真想知道他们凭什么发电报给我,内容居然只是广告而已?"泰晤士报刊登了这封令人不爽的电报,结果又给那个发送者带来了更大的宣传效果。

这是2007年12月13日《经济学家》的专栏文章Getting the message, at last里的一则小故事。这一事件被历史学家Matthew Sweet看作是史上第一个关于"垃圾邮件"的案例。它再好不过地反映出,一种新技术的出现,有时候会给社会关系和社会行为带来任何人都无法预料的变化。新的秩序只有通过反复的摸索——伴随着混乱和不适感——才能得以在人群中慢慢建立起来。

毫无疑问,今天我们正处在这样一个变化的时代,如果你稍稍回忆一下你所熟悉的那些网络应用,你一定会注意到层出不穷的令人困惑的新问题。例如:

电子邮件的标题是干什么用的?应当怎么给一封信起名字?(看看你的邮箱,你会发现不同的人有完全不同的做法。)

如果要给很多人群发电子邮件,让他们彼此看到所有接收者的名单是合适的么?(一种比较礼貌的做法是把主收信人设置为自己,把所有的接收者放进"暗送(BCC)"列表。)

即时通讯软件上的名字应当如何更换才会不给别人带来困扰?(越来越多的人同意,名字应当包含两部分,固定display name,平时只更换personal message,即MSN messenger的模式。)

如果你的老板在facebook上加你为好友,你应当如何回应?(Facobook设计出来就是为了反映真实的人际网络的,所以你无法再用分开网上和网下生活的办法来回避这个问题了。)

如是种种。

但是和电报或者电话刚刚发明的时代有所不同,我们这个时代技术革命的程度和速度前所未有,以至于社会关系调整的速度几乎跟不上如此剧烈的变化。电报,电话甚至包括移动电话,都可以在某种程度上看作一项孤立的发明,而互联网(特别是web2.0之后的互联网)却并非如此。Web2.0的一个重要特点在于,大多数那些传统上需要通过安装特定软件才能实现的功能(例如字处理、日程管理乃至个人文档管理)今天都可以通过最普通的网页浏览器得以实现。——这一点google甚至还远远算不上领先者,更纯粹的完全基于网络浏览器的"真正意义上的"操作系统已经有了好几个版本(例如著名的eyeOS:
http://www.eyeos.info/)。只要打开你的网络浏览器并且登陆,就能看到一个惟妙惟肖的虚拟的操作系统桌面,你甚至能够拖动里面的图标。2007年apple推出了功能强大的iphone手机,当批评者质疑这款手机不能由用户自己安装软件时,apple的回答是,iphone配备了功能完善的网络浏览器,所以事实上你可以在iphone中得到你想要的各种功能,只要有人在网络上实现过。

在这些事实背后是网页编程技术的迅速发展。传统的web 1.0网站还基本上只是一些固定的文字网页和超链接的集合,而web 2.0时代的网站已经很大程度上被"软件化"了。比方说,你很难说google docs或者facebook或者上面提到的eyeOS究竟是一个网站还是一款借助浏览器实现的软件。请记住,一个web 2.0网站所提供的不是信息本身,而是让用户可以创作并交流自己的信息的平台,网站的成功也不外乎是平台模式的成功。web 2.0时代的暴发户们,
无论是youtube还是facebook,无论是del.icio.us还是twitter,统统都只不过建立在关于组织用户互动的一两个简单而有效的创意上。所以在某种意义上说,每个成功的web 2.0网站都是一个独立的新发明,发明的对象不是新软件,不是新产品,可是和它们一样重要——也许更重要。

不仅如此,web 2.0时代所特有的web widget(网络功能扩展)现象使得这种技术创新的速度进一步的加快。让我们看看Facebook的例子,它甚至都不应当仅仅被称为一个发明,而是一系列发明的总和。从2007年5月开始facebook网站允许用户自行为facebook编写各种功能插件,截至2007年底,facebook上已经有了超过一万种插件,能够实现的功能从用户之间聊天送礼到下棋无所不包。在这里,web2.0的特点体现得淋漓尽致:
网站仅仅提供了最基础的平台,其余的一切——包括平台的功能本身——都交给用户来决定。事实证明,一旦每个普通用户的能量被充分的调动起来,技术创新的速度就变得不可限量。用户的广泛参与所带来的不仅仅是信息量的爆炸,还有未来的互联网世界的"可能性"的爆炸。

为此,2006年年底的时代周刊前所未有地没有把自己一年一度的年度人物称号被颁给任何一个政经钜子,而是颁给了坐在电脑前面的""。

于是网络社会就在每一个"你"的作用下一点点成型,一点点调整,日趋完善与复杂。这个社会的的互动模式远远超出了现实生活的深度,演进和变革也远远超过了现实生活的速度。传统社会需要经过漫长的调适和阵痛才能够适应的新模式在一夜之间诞生,然后在下一夜又被更新的盖过。人类关于信息交流的可能性被极大地拓展了,手段被无限地丰富了,——在大多数人甚至还没注意到的时刻。

而与此同时我们无奈的意识到,人类社会为了迎接这个新时代所需要的思想储备远不足以适应技术的发展,更遑论对未来的预测和洞察。由于众所周知的原因,大多数人文知识分子往往恰恰是对互联网革命最不了解的一群人,他们对现代信息技术的爆炸式发展不屑一顾,认为那就像时髦的游戏机一样只不过是过眼云烟,什么也改变不了。——不用互联网也可以活得好好的,不是么?

回到这篇文章的开始,我说过,我坚信互联网是人类文明史上最重要的发明之一,而互联网里每一项新鲜的观念(无论它看起来有多么技术化),最终也必将深刻的影响全体文明社会。

为什么要关注互联网里的天翻地覆?因为你的"不关注"也会改变它。十年前我们可以把世界分成"线上"和"线下"两个部分,那个时代已经过去了。无论你是否愿意,你都不再只是个旁观者。时间的脚步不会停顿,舞台的大幕已经拉开,我们每个人都是演员,而脚本却付之阙如。这个崭新的舞台上的一切规则、秩序、道德、义务、还有——理想,都要通过千千万万的"你"来塑造和实现。

你准备好了么?

 

 

Things you can do from here:

Be the first to comment

标签时代(三)

Posted 2008/01/22 By Andy

 

Sent to you by Anting Xu via Google Reader:

 

 

 

标签时代(三)

via 木遥的窗子 by 木遥 on 1/20/08

试图在"平等"的互联网建立秩序的另一个例子是搜索引擎结果排名。众所周知,无论是哪种搜索引擎,其结果的排序都是一个引起巨大争议的话题。这是web 2.0的另一重内在矛盾——无限增长的内容同用户有限的注意力之间的矛盾——的外在反映。 我们常常注意到google或者百度声称返回了几十万条搜索结果,可是很显然,这些搜索结果只有前若干页才具有实际意义,一百页之后的结果永远不会有人关心。——对于曾经为了信息爆炸而欢呼的人们来说,这一现实颇为讽刺。

不得不承认,搜索引擎结果排名不仅仅是个技术问题。既然网页和它们的撰写者彼此平等,凭什么排名会有第一和第一万的差距?搜索引擎公司总是声称它们尽力做到排名的公正,但是无论如何,既然有排名,就是在结果中引入了不平等,于是关于"公正"的定义就颇需要煞费苦心的思量。一个被普遍声称的原则是让最有价值的网页排在最前面,而为了能让电脑自动判断网页的"价值",Google最原始的想法(也是后来几乎所有搜索引擎算法的基础)是计算"外部链接"的数量:一个网页被别人链接的越多,这个网页就被认为越有价值(在某些关于搜索引擎技术的描述中,网页的一个外部链接被称为外部网站对该网页的一次"投票")。问题在于,这个算法过于简单以至于太容易被作弊所干扰,于是google设计了一套复杂的公式来避免可能的不合理结果,并且尽力将算法保密以避免有针对性的作弊。反过来,因为在很多情形下搜索结果排名同巨大的经济利益相关联,于是各种面向网站的SEO(search engine optimization)技术就应运而生。这些技术声称能够让你的网站在搜索引擎结果里的排名大幅上升,而其秘密不外乎通过对搜索引擎搜索结果的分析反过来推测其算法,然后有针对性的利用各种网页编程技巧"合法的"提升网页的权重。而搜索引擎公司为了保证结果的所谓公平性,也只好不断的更新反作弊算法。这种猫捉耗子的场面是web
2.0时代蔚为奇景的一幕。

问题在于,不管搜索引擎公司怎么更新算法,对"公正"的定义权本身总是被搜索引擎公司把持着,并且不透明。——这种巨大而不受制约的权利在现代社会里委实是个异数。在某种意义上来说,google几乎行使了一部分政府公权力的职能,这也是google反复声称自己"不做恶"来取信于公众的原因。

由于web 2.0的内在特点,搜索引擎在新时代的互联网中占据了一个特殊的地位。在某种意义上来说,搜索引擎就是互联网的操作系统:从前人们通过windows来接触和查阅电子资源;今天人们通过google来做同样的事;从前人们需要不厌其烦的给自己的电子资源建立目录树,从而实现对电子资源的有效查询,今天人们只需要给电子资源贴上标签(或者使用电子资源内在的标签)就足够了,森严的逻辑结构已然过时;从前人们生活在信息资源的匮乏之中,今天人们生活在信息过载之中,要看什么google就能给我们什么。看起来人们像是(部分的)被解放了一遍,而google就是我们的解放者。

今天这个解放者越来越庞大的身影几乎笼罩了电子生活的每一个角落。越来越多的迹象显示google早已不甘于仅仅做一个搜索引擎之王。当google在推出google desktop的时候,很多人都注意到这个桌面搜索软件在桌面上建立了一个工具条,里面附带了许多小功能,例如显示邮箱里的信件,或者显示日历及约会,甚至显示地图等等。借助这个工具条,google几乎是在windows的桌面上嵌入了一个小型的操作系统,可以完成很多虽然简单但是重要的功能了。从那时起,人们就开始讨论google对操作系统市场的野心。随后google一点一点完善着自己的产品线,到今天为止在网络浏览器上能利用google做的事情已经涵盖了邮件,即时通讯,日历及日程安排,购物,RSS订阅及分享,RSS烧制,照片分享,视频分享,网络收藏夹管理,网络浏览记录管理,社会化交往,地图查询及私人地图管理。随着2007年9月google presentation的上线,google终于有了基于普通网络浏览器的完整的办公套件——字处理、表格处理、幻灯片制作,还有多少事情是一台普通的本地电脑能做而google不能做的?

所以人们把越来越多的互联网生活绑定在google上,从购物到远程联络,从日常阅读到办公,google已经成为许多用户在互联网上的家,知道用户从联络方式到信用卡号码到网络浏览记录的全部隐私,而它居然仅仅是一家私人商业公司!

相信不相信google?这是个问题。"不做恶"的口号很显然有把自己同名声不甚完美的微软区隔开来的想法。可是微软虽然霸道,也只是控制了用户个人的桌面而已。而google扼住的却是电子世界里信息交流的咽喉。

(在中国的情形更为糟糕,占据市场独大地位的是百度,而这家公司甚至连"不做恶"也无法承诺——众所周知,百度常常由于各种原因人为修改搜索结果——于是我们只能束手无策的接受百度所提供的"公正",连自欺欺人的心理安慰也得不到。)

我们当然不妨姑且相信"不做恶"的google不会人为的屏蔽和封锁我们通向信息的渠道(2006年一次众所周知的风波已经构成了一个致命的反例),可是即使确实如此,在google日渐完美的搜索排序算法的帮助下,我们真的开始生活在幸福的信息自由世界里了么?

一个重要的事实是:搜索的反面就是过滤,这是这个信息过载的时代我们必须付出的代价。我们可以阅读的东西不是太少而是太多了,我们必须取舍。当然了,我们会舍去我们不喜欢或者不感兴趣的内容,只专注于我们欣赏的信息。这听起来当然是"自由"的题中应有之意。可是网络之大,浩瀚无边,于是我们需要借助搜索工具来替我们筛选信息,只留下合乎我们心意的声音。所以豆瓣会试着推荐我们大概会喜欢读的书,pandora会推荐我们大概会喜欢的音乐,而google也试图推出所谓的个性化搜索——根据以往的搜索和阅览记录来推测我们的口味,从而专门按照我们的喜好来陈列搜索结果。

这是多么无微不至的帮助……这是多么危险的帮助!幸好google的个性化搜索今天还没有全面铺开。我一想到我看到的搜索结果是专门针对我的个人爱好而订制的就浑身不舒服——像想到搜索结果因为政治原因被屏蔽一样不舒服。搜索引擎就是我们在互联网上的眼睛,而我想看到的是一个真实的世界,不是一个为我的口味订做的世界。由别人来决定我应该看到什么不应该看到什么——纵然这个"别人"不是老大哥而只是一个机器算法——也是不能令人容忍的。

芝加哥大学的Cass Sunstein注意到了这个问题。他在《republic.com》一书中指出,对个人接收的信息的任何筛选——哪怕是完全迎合个人需求的筛选——都是反自由的。只有被置于共同的(也许是粗砺的和不受喜爱的)信息环境下,人们才能够建立共同的话语环境,从而形成公共讨论的传统,而在web 2.0这样一个本质上是自助餐式的环境里,每个人都是被宠溺的消费者,任性地选择着世界的面目。 每个人都只能越来越多的听到自己声音的回响,甚至形成集体性的极端立场——Sunstein称之为"群体极化(group polarization)"。在这个环境里,个人选择的权力被强调了,而倾听和容忍其他选择的责任则被忽略了。信息世界里一切先验存在的结构都被消解了,只有自我的声音被放大了。

Sunstein意味深长的引用了美国最高法院大法官Louis Brandeis的话:自由最大的敌人是疏懒的人民,公共讨论是一种政治义务。

在搜索引擎介入一切的时代,个人没有义务。什么信息都可以通过搜索得到,什么观点都可以找到志同道合者,什么商品都会有市场,什么自我都会被放纵和原谅。为了迎合一个精英化的既定秩序而整理、锤炼、磨砺自己的思想已经显得不合时宜,不同的论点之间的辩难和争执、说服和改错也变得不再必要。这是搜索引擎给我们的自由,是互联网时代标志性的"多元化"。

为了讴歌这个时代,Thomas Friedman在2005年出版了畅销的《世界是平的》(The World Is Flat)。这个名称在今天看来格外讽刺,因为flat的另一个意思便是无聊。

 

 

 

Things you can do from here:

Be the first to comment

标签时代(二)

Posted 2008/01/22 By Andy

Sent to you by Anting Xu via Google Reader:

 

 

标签时代(二)

via 木遥的窗子 by 木遥 on 1/20/08

让我们暂时离开这些关于电脑技术的讨论,把问题换一个更本质一点的问法。假如完全不考虑检索和管理的难度,单从逻辑层面出发,我们会更喜欢一个怎样的信息管理方式?

回到维基百科这个例子。在维基里,几百万个词条被置于平等的地位,无论是"美国"还是"美国总统大选",无论是"动物"还是"北极熊"。没有主次,没有归类,维基的成功证明了我们的确能够这么做,问题是,我们应当这么做么?

万物各归其类是人类思想中根深蒂固的因子,我们当然可以说对归类的癖好只是传统介质难于检索才导致的后遗症,可是事情也许并不这么绝对。如果四库全书是在电脑时代才开始编撰,《孟子》应该归于经部或者子部的问题还存在不存在呢?或者换一个问法,如果我们完全不必依赖分类目录树的结构也能够实现浩如烟海的典籍的快速检索,那经史子集的分类还是否必要呢?

看看另外一个有趣的例子。在我上小学的时代,自然数一直被定义为正整数,也就是说,零是不算自然数的。大约从上世纪末开始,小学课本里把零算作自然数。在最新的一部分教材里似乎零又重新被排除在自然数之外。——这种变更当然引起了一定的混乱,而且是不必要的混乱。归根结底,数学里的任何命题都不会因为零算不算自然数而发生一丝一毫的改变,顶多是叙述上要稍作修改而已。为什么我们一定要斤斤计较于零算不算自然数这样一个无聊的问题呢?

这个问题其实不像它看起来那么无聊,即使在数学家内部对它也有不同的回答。大多数数学专业文献默认零不属于自然数,华罗庚的《高等数学引论》的开篇第一句话就是:

数是数出来的,1,2,3,4,5……这样数下去,就得到了自然数。

可是著名而传奇的的数学家组织布尔巴基却在二十世纪三十年代开始编撰的《数学原理》中宣称零应当被算作自然数,理由是,自然数是计数的产物。所谓计数就是给集合定义元素个数,即所谓集合的势(cardinality)。既然空集也是集合,那零当然也是自然数。——这并不是一个无关紧要的论断,对数学史有所了解的人都知道布尔巴基学派是怎样深刻的影响了二十世纪数学的发展,而这一学派的数学思想的一个核心就是用并且仅用集合论的语言规范的叙述一切数学知识。在这一哲学的指导下,把零算作自然数就变成了强调集合的基础地位的题中应有之意。

这是分类问题的"非实用性"的一个典型反映。每一个数学家都知道一个具体的定义对数学命题的推演来说完全无足轻重——重要的不是一个概念叫什么,而是它和别的概念是什么关系——可是数学家们仍然总是花费大量的心血去为每一个定义选择合适精确的表述。关于函数这个词的确切意思的争论几乎贯彻了十九世纪的始终,实数这个词的命运也类似,人们花了很长时间才意识到把解析函数从一般的实函数中强调出来并不是对实函数的一个本质分类(而复函数是否解析这一分类却要本质和深刻得多)。数学史上这几场著名的论战对数学发展的推动意义完全不亚于一个个具体的重要定理的证明。我们必须承认,不仅仅知识本身是重要的,有时候关于知识的分类和逻辑层次的描述也一样重要,甚至更为重要。强迫你分类,强迫你选择,强迫你清晰的界定非此即彼的界限。——在这样的讨论中,人们才能在哲学层面上更好的梳理知识体系的秩序,而不是仅仅把它看作一堆具体结论的集合。所以关于孟子的归类才是一个学术问题而不仅仅是技术问题。我们需要秩序感。

而秩序感却是web 2.0社会里最缺乏的元素之一。
还是回到维基的例子。如果说目录树体现的是概念之间的等级制,那我们不妨说维基实现的是绝对的平均制。——这种词汇的平均背后隐藏的是人的平均,维基没有确定的编者,只有匿名的无数网友,任何一种比平均制更复杂的逻辑体系几乎都在客观上无从建立。每个人会有每个人的侧重,于是折中的结果是,所有的词——除了根据词条已有内容的长度而划分为正规词条和stub(即短词条)两种规格以外——在地位上一律平等。

这种绝对平均制带有一点哲学上的审美意味,以至于自维基诞生之日起,对它的赞叹和质疑就不绝于耳。赞叹者说这是人类历史上亘古未有的创举,是第一座真实耸立的巴别塔,是人类民主和谐梦想的完美缩影。质疑者说平均带来的是词条质量的极度不稳定和权威性的下降,是把百科全书的编撰从一项苦心孤诣的学术活动变成了一场众人的狂欢。要精英还是要大众?要民主还是要集中?要秩序还是要平等?在人类社会里存在的经典取舍难题在网络上依然存在。

del.icio.us,youtube和豆瓣等等web 2.0网站也都存在着类似的矛盾。所有基于标签的网站都面临着一个共同的难题:标签集合的建构。在"维基哲学"的指导下,几乎所有的系统都把标签的建立权交给了普通用户,于是,标签的重复和不规范就成了一个老大难的问题。很多网站对此提出了一种软件层面上的部分解决方案,即让用户管理标签里的"同义词"来归并重复标签和同一标签的各种不规范形式,可是这一方案仍然依赖于匿名网友的参与,于是不规范性和不稳定性也会在这一层面上接着存在……归根到底,一个人人都有权编辑的知识系统有可能渐渐收敛于稳定和高质量的状态么?这是很多web
2.0网站所面临的困境的核心。

(甚至还存在这样一个极端的例子:企鹅出版集团在2007年2月1日推出了"百万企鹅"的实验性计划,邀请全球网友以维基的方式共同创作一部小说,每个人都有编辑权,只是撰写量有250词的限制。这部小说现在已经定稿,可以在http://www.amillionpenguins.com/上看到,其质量如何,请各位自行评判。)

我们不知道上述问题的答案,这是人类历史上不曾有过的尝试,而它的出现也不过几年光景,人们对它的规律还远远谈不上了解。自由主义者会乐观的宣称维基在短短几年里的爆炸式发展已经足以证明维基能够实现其梦想,即"维基百科"这一词条的解释里所说的:为地球上的每一个人提供的自由的百科全书——用他们选择的语言所写的,全世界知识的总和。 而精英主义者当然会对此心存疑虑,人类经过了几千年的实践也不曾摸索出现实社会里让所有人平等参与而又稳定高效的完美机制,凭什么相信互联网上不费吹灰之力就能做到这一点?事实上,正如我们从生活中学到的那样,纯粹的平等话语权很有可能只是一座海市蜃楼。对维基的编撰体制有稍微深入的了解的人都知道,即使在维基这个号称人人平等的机制下,也仍然存在着"编辑"这一特殊群体,他们对词条的控制力比普通用户要大得多。当然理论上编辑也是普通用户中的一员,可是我们不妨套用我们都心照不宣的那个句式:所有的用户都是平等的,但是有些用户……更为平等。

"说来说去都是一个老故事,故事虽老总在重演永远新。"这是人类真实困境的一个缩影。一代又一代的传统知识分子试图用一张巨大的目录来网罗人类所有的知识,他们做的并不怎么成功。在互联网时代这一梦想从来没有这么接近现实过,代价是目录不见了而标签出现了,对知识建立结构的权力从精英下放给了大众。——一旦每个人都能够掌握平等的权力,秩序会如何诞生?以什么形式诞生?在传统社会里,几千年来人们都没有找到完美的答案,那么在网络社会里呢?

必须牢记,网络社会并不只是传统社会的网络版而已。

 

 

Things you can do from here:

Be the first to comment

标签时代(一)

Posted 2008/01/22 By Andy

Sent to you by Anting Xu via Google Reader:

 

 

标签时代(一)

via 木遥的窗子 by 木遥 on 1/20/08

如果要在我的记忆里为web 2.0找一个对我来说印象深刻的起始坐标,我想应该是2004年的愚人节。

那一天,google戏剧性的发布了gmail这个划时代的产品。在所有的邮箱服务商都斤斤计较2M还是4M邮箱容量的时候,google宣布它的邮箱容量为1G。我相信很多人都和我一样还记得这个消息带来的冲击。Google说,我们相信很久以前的信有时候也是有价值的,所以我们希望能够使得我们的用户不怎么需要删除旧信,所以邮箱当然是越大越好。

可是信攒了那么多,怎么收拾呢?分类,管理都是个麻烦事。Google说,你忘了我的本行是什么了么?不用管理,不用建立目录。你可以给你的重要的信加上若干关键字,想用的时候搜索就好了。

Google起家当然是因为搜索,而搜索引擎的壮大背后是互联网信息量几乎无限制的增长。从2M的邮箱变成1G的邮箱,反映的是信息爆炸的速度。可是这些信息是从哪里来的呢?把报纸搬上网络,把商店搬上网络,就会有这么多新信息么?

我请大家和我一起回忆一下十年前我们用浏览器看些什么内容:那时的热门网站有新浪,有搜狐,当然还有别的大同小异的网站用来看新闻、看小说。而今天,我们的浏览器里仍然有这些内容,可是还多了维基百科,多了youtube,多了豆瓣,还多了无数大大小小的blog。

请注意这些新生网站和它们的前辈的一个微妙而本质的差别:几乎所有的经典网站都是内容的提供者,我们看到的是和经典的报刊书籍类似的内容。几乎所有的的新兴网站都不提供内容而只提供空间和发表机制,我们在上面看到的一切具体内容都是我们自己提供的。——这是一个安静而深刻的转型,网站的角色从内容提供者,变成了信息组织者,而信息的提供者变成了我们自己。

这个转型的产物,就是人们一般所说的web 2.0。

某种意义上来说,这才是互联网上无限增长的信息的真正来源:我们自己的撰写。这些新的撰写和从前的时代里的任何撰写都不同,它们从诞生之日起,就建立在电子技术之上。它们具备传统信息所完全没有的庞大数量,也摆脱了传统信息天然具备的物理负担。所以,仔细观察这些崭新的信息的组织方式,我们就能够在某种意义上了解什么才是对管理和收藏信息来说真正的要素,什么只是旧介质的无奈累赘。

一个鲜明的事实是:几乎所有的新兴网站都遵循了一条简单的管理准则:要标签,不要目录。

什么是标签?标签是一个元素的多个属性描述。什么是目录?目录是一个元素的层层单一归属。当我们写了一篇日记,写到了一次旅游里波士顿的中餐馆的印象,我们希望用哪种方式来标识这一则日记?是"旅行、中餐、波士顿",还是"日记/旅行日记/波士顿旅行日记/关于中餐馆的波士顿旅行日记"?答案是前者。

(顺便说一句,你没准又忍不住选择"日记/关于餐馆的日记/关于波士顿餐馆的日记"这另一条路径,每个整理过手头收藏目录的人都体会过变更目录树的痛苦。)

更关键的是,如果我们希望别人通过搜索引擎看到这篇文章,我们是希望他搜索"旅行、中餐、波士顿"中的任何一个词就能看到,还是沿着"../…/…./….."这唯一的路径才能走到?答案也是前者。——这就是为什么几乎全部的web 2.0网站都建立在标签的基础上,因为这才是更自然的方式。

让我们看看维基百科。截至今天为止,英文维基已经收录了两百多万词条,中文维基也有近十五万条词条。它已经是人类历史上最成功,影响最广泛的百科全书之一。随便点开一个词条,譬如美国总统大选,词条的地址是:

http://en.wikipedia.org/wiki/United_States_presidential_election

注意这个地址,在http://en.wikipedia.org/wiki/后面直接就是词条本身。几百万个词条,无论是"美国"还是"美国总统"还是"美国总统大选"还是"2008年美国总统大选",无论其重要性为何,都被放在同样的层次之下。没有目录树。

让我们看看youtube,这个建立只有三年的网站在今天的互联网流量排名上位居全球第四,收录超过五千万条视频,每天有超过一百万条视频被点播。当然,这些视频的组织完全依赖于标签和搜索。没有目录树。——本来你也很难给一条关于同学生日聚会的录像以合适的编目。

(回想一下生活中的那些影视资料馆吧,阴暗的架子上面贴着模糊不清的分类编号,大家弯着腰眯着眼睛仔细查看厚厚的目录本子。)

让我们看看del.icio.us,如果你还不知道这是什么的话,恭喜你,你落伍了。这是今天全球最主要的网络书签中心。人们用它代替了自己电脑上的收藏夹,并且把自己喜欢的网页推荐给别人。人们可以随时随地在任何电脑上查看自己喜欢的网页列表,或者看到别人眼中的好网页。当然了,所有的网页都是以标签来标记的,没有目录树。

(作为对照的是,本地电脑上的收藏夹却是典型的目录结构,可是越来越多的人已经不再用它了。)

最后再让我们来看看整个互联网本身。还记得若干年前一个典型的门户网站的样子么?比如Yahoo,首页上就是一个庞大的目录,左右上下排列得整整齐齐。今天谁还在用那样的门户目录?我们只要Google就够了。

(顺便说一句,其实google也有一个基于目录树的版本:http://directory.google.com/。 有多少人用过?)

不用分类管理,关键字标签就够了。Gmail当年的宣传语现在看来格外意味深长。目录树的建立很大程度上基于传统时代人们对于快速检索实体信息的需要——准确的定位、单一的路径以及缩短相似信息之间的物理距离,为此我们不得不忍受着它的种种不便(我不需要在此列举这些不便,任何一个曾经试图整理大量散乱资料的人都有所了解)。互联网的历史告诉我们,一旦基于电子搜索引擎的大规模检索方式成为可能,目录树的概念几乎立刻就被抛弃了。

我们不妨猜测,假如人类文明自始就建立在电子基础上,先天的具有快速信息检索能力,那么目录这一结构是不是远远不会扮演今天这么重要的角色呢?

事情当然不会这么非黑即白的简单,现成就有一个显然的反例存在。我口口声声在讨论电子资源,可是电子资源的大本营——电脑,却是建立在目录文件结构之上的。这又作何解释?

这个问题恰恰反映出了标签系统的一个缺陷。尽管它建立了一个极易为用户接受的查询和使用机制,可是它的非线性的特点使得它实在是难于用机械算法来直接实现——于是就出现了上述吊诡的事实。一方面,借助电脑,人类终于得以摆脱目录结构的桎梏,进入标签的自由世界;另一方面,电脑本身却极大的发挥了目录结构的长处,才能够快速的存取数据交换信息。通过数据库技术,电脑得以实现出越来越精致易用的面向用户的信息管理和查询界面,让我们能够最快最准确的迅速得到想要的信息,可是电脑自己的文件系统却倾向于建立在经典的目录树结构的基础上,至少在常见的文件系统下是如此。

事实上,把自身的目录结构在用户面前隐藏起来正是电脑操作系统的一个重要的发展趋势。说到底,电脑上有几个磁盘,每个磁盘下有几个目录,每个目录下有几个文件,这和用户有什么关系?这完全不是真正让用户觉得自然的方式。不幸的是,囿于操作系统技术的限制,尽管我们已经从网络上的目录树里解放了出来,却还困在本地电脑上大大小小的文件夹里。如果你像我一样整理过大容量的硬盘收藏,你一定和我一样同意把目录结构应用于电子资料的过程简直让人发疯:建立科学方便的分层目录极其耗费和精力,更不用说总有那么几个特殊例子的难于分类。如果偶尔还需要调整一下分类方式,工作量更是大的吓人。我自己的电脑上有几百G的音乐文件(只是古典音乐,这已经够理想了,至少我不用操心古典音乐和流行音乐不同的分类特点),而我从来就没有把他们以令人满意的的方式成功归类过。按作曲家划分?按创作时代划分?按体裁划分?按风格划分?按国别划分?按CD专辑编号划分?我常常笑话那些放着电脑在前面还要费劲打草稿算乘法的人,可是我自己还是不得不面对着电脑干如此艰巨的体力劳动,并且处理的事情还是电脑最擅长的数据管理,一想到这个事实我就气愤不已。

所以人们一直在努力着,一步步的把用户和目录隔离开来。用过itunes的人也许注意过这样一个事实:itunes管理的音乐本身是以极其复杂的目录格式存储在硬盘上的,可是那和用户并没有关系,用户面对的只是itunes的界面,在那里可以随心所欲的按照任何属性寻找自己想要的音乐。另一个例子是google desktop,google声称这款软件可以让用户像搜索互联网一样搜索自己电脑上的内容,忘掉真实的目录,想要什么内容的时候直接搜索相关的关键词就可以了。

(至少就我看来,这两款软件都还远远称不上真正好用——本地信息管理技术的发展远远的被网络上的对应技术抛在后面,这真是让人沮丧。)

所以在理想的技术手段下,我们既不需要关心文件怎么存放也不需要知道它的任何分类信息,那都是电脑的事情。我们需要的只是一个纯粹的用户界面,在那里我们看不见文件夹也看不见目录树,我们只看见电脑对我们说,先生您要点什么?

我要听贝多芬的最后一首弦乐四重奏的第四乐章,要Emerson重奏组的版本。我还要看一看清朝一个诗人的诗集,我忘了他的名字了,但是他写过一句"国家不幸诗家幸"来着。

于是音乐开始播放,赵翼的诗集也打开了。

这并不是什么遥远的事实,实际上,新一代的更傻瓜化的操作系统已经站在门口准备敲门了。如果有人还没有听说过微软的surface计划,我强烈建议他去看一看http://www.microsoft.com/surface/上的三段视频。请注意视频里那些令人惊叹的操作并不是伪造的录像,那是一台真实的原型机,也就是说,我们离它已经不远了。

 

 

Things you can do from here:

Be the first to comment

标签时代(序)

Posted 2008/01/22 By Andy

全文转载未名BBS Reader版newforest的文章(共五篇)

 

 

Sent to you by Anting Xu via Google Reader:

 

 

标签时代(序)

via 木遥的窗子 by 木遥 on 1/20/08

当我开始在脑海里构思这一组文章的开头的时候,心里浮现出的第一份材料,来自于十年前的《读书》(那差不多是我刚开始读这本杂志的时候)。1997年的第一期上有一篇文章叫做《数码复制时代的知识分子命运》,作者是严锋。我从google上找到了这篇文章,摘抄一段有趣的话在下面:

我手头有一张光盘百科全书,叫做Encarta96。里面有三十大卷的文字,加上大量的图片、音乐、电影等多媒体材料,制作非常精美,令人眼花嘹乱。有一次,我在上面查阅"小说"这个条目,发现内容相当丰富,本身就是一篇挺长的文章。在这篇文章中,有许多粉红色的关键词,例如"史诗"、"罗曼司"、"文艺复兴"、"薄伽丘",等等,相当于传统书籍中需要加注的术语、人物、事件。但是,在Encarta96中,注解并不出现在书的角落或结尾处里。我用鼠标点一点"罗曼司",发现自己就立刻跳转到了另外一篇文章,而且又有许多粉红色的词散布其间:"中世纪"、"罗曼司语言"、"亚瑟王"、"圣杯"、"贵族之爱"。因为想搞清楚"贵族之爱"到底是怎么回事,更因为鼠标点起来实在又方便又好玩,我来到了"贵族之爱"这篇文章。从"贵族之爱"我又跳到了"封建制"。"封建制"里面有一个奇怪的粉红色的词"Samurai",忍不住又要用鼠标去点一下,于是知道那是日本武士的意思。在"Samurai"这篇文章里,又看到一个很有特色的词"Harakiri",虽然心里已经猜到了八九分,但还是想证实一下,于是又点了一下。不错,正是"切腹自杀"。你看,从"小说"出发,最后却闹了个"切腹自杀"。我每次使用Encarta96,都难以逃脱这样的厄运,它像一个极为健谈的人那样,总是离题万里,越扯越远。

说它有趣,是因为我们今天看到都会会心的一笑。这里讨论的不过是今天司空见惯的超链接,可是在1997年,这件事情是如此的神奇,以至于需要在《读书》上大书特书。我对这篇文章印象深刻很大程度上也是因为这段话。在那个大多数人还不知道互联网为何物的时候,这篇文章给我描述了一个极为瑰丽的陌生世界:全世界的文本都被超链接连接了起来,天哪。

至少在中国,这篇文章毫无疑问的走在了时代前面。

从那时起到今天,十年过去了,互联网已经发生了翻天覆地的变化,而知识分子对互联网的了解却似乎还停留在十年前的状态。2007年第九期的《读书》上刊登了胡咏写的《比特城里的陌生人》。作者讨论是的网络社会, 却很显然对社会化互联网的了解还局限在博客上可以刊登私人照片这样的层次。——这本该是多好的一个题目啊,就这样被浪费了。

在这十年里发生了什么?今天的互联网和十年前有什么不同?这不是本文所能涵盖的主题。但我想说的是,每一个今天的知识分子都不应该自外于这个话题。——我坚信互联网是人类文明史上最重要的发明之一,而互联网里每一项新鲜的观念(无论它看起来有多么技术化),最终也必将深刻的影响全体文明社会。

让我以下面这个例子作为开始。它有点偏题,但是再好不过的说明了这样的道理:一项简单的技术应用会对文化生活产生比乍看起来要大的多的影响。我要讨论的是今天炙手可热的时髦词汇:长尾。

设想你发明了一件产品,根据生产成本估算你需要售出至少五百件以上才能获利。现在经过调查你发现全国大概有一千个人会对这个产品有兴趣。你会生产它吗?

在传统经济的模式下,答案是不会。原因是,这一千名潜在的顾客分散在社会的各个角落里,你根本无法让他们都注意到你的产品——广告费用会是天文数字。让小众注意到你的产品和让大众注意到的难度是一样的,而收益却不同。所以,一个直接的推论是一件商品只有在大众中间有流行的可能才会被生产出来。

可是在互联网经济模式下,答案是会。原因是,一个人只要对你的产品有兴趣,他就总能通过某种渠道注意到你的产品的存在——他可以主动的搜索。你不需要打广告也会有客户,你也不需要租用实体店铺来贮存商品。其结果是,在传统经济时代不会生产的小众产品在互联网时代得以生产并盈利。

(任何一家商店的产品销售柱形图都有一个隆起的头部和一个长长的尾巴。头部是畅销产品,长尾是滞销产品。传统模式下只有头部才赚钱,互联网时代长尾也赚钱,这就是这个时髦词汇的来源。)

听起来不错,可是这和文化有什么关系呢?

那就想象一下上面这段论述的另一个版本。一本图书,如果全世界只有一千个潜在的读者,那么在传统出版模式下这本图书根本不会得以出版,而互联网时代却会。这不是理想推导,而是已经存在的事实。Amazon网络书店有一多半的销售额来自于图书销售榜上排名在十万之后的图书。而在任何一家传统书店,这种书都根本没有上架的机会。——请注意这件事情的深刻含义:无论多么小众而另类的思想,只要勉强还有几百个受众(总是会有的),都能得到商业传播的机会,顺利的抵达潜在的读者手中。这是人类历史上的第一次。

声音微弱的话语在今天声音依然微弱,可是不再会被商业的力量强行淘汰,想想看这件事情会对文明的传播产生多大的影响。——我知道精英主义者会指出这未必是什么好事情。可是我并不讨论好坏,我说的只是影响。

这不是本文的全部主题,可是多少有点联系。它告诉我们仅仅一种重新组织信息的方式就能产生多么大的力量——不仅仅是让Amazon书店的营业额番了一倍而已。这正是web 2.0的核心含义。

是为序。

 

 

Things you can do from here:

 

 

Be the first to comment