图书馆之怪象汇总- -| 回首页 | 2005年索引 | - -NSF第三次赛百结构研讨会

本体被高估了吗?- -

                                      

昨天看到easy librarianClay Shirky的演讲Ontology is overrated表了不同意见,深有同感。很早当了这个演讲的MP3,听了很不对味,里面不乏一些真知灼见,例如后半部分对于tag folksonomy的看法,然而整体来说除了感觉有些哗众取宠之外,还有不少对本体和分类法应用的误解,例如下面两位所指出的:

Chris May:"Hierarchical ontologies are fundamentally not suitable for non-physical information because they're predicated on an object being in one place at one time - which isn't true"

Mark Taylor:"Shirky believes that, ultimately, the choice between structured or unstructured metadata boils down to a philosophical question: does the world make sense, or do we make sense of the world? I prefer to believe that the question is: is everyone equally capable of making sense of the world, or are some better qualified to do it than others?"

(转引自Alex Barnett blog http://blogs.msdn.com/alexbarn/archive/2005/04/10/406909.aspx

但是从许多留言来看,大多数人都认同了Shirky的观点,很遗憾。

总体上,Shirky所讨论的本体就是传统的分类法taxonomy,通篇演讲没有谈到本体除了分类法之外的东西。实际上我们知道本体的含义比仅仅一个分类体系要广泛的多,一套词表也是本体,一套公理体系(例如欧氏几何)也是本体,甚至一套草根分类法也可以看成本体,等等。Shirky为任意链接和草根分类法而欢呼,然而过于贬低传统分类法就不厚道了。Shirky举了一些例子,来证明人们对于分类法的常识全都是错的,在他看来,传统的分类法莫名其妙,甚至是一无是处。例如他认为元素周期表可以说是最完美的传统分类法,然而也不能尽善尽美,惰性气体就不一定是气体,放在一起合适吗?(这似乎太过于苛求了吧?);苏联分类法中把马列主义作为分类法的起始大类,(中图法还不是那么有名,所以他没有列举),显然这是历史的产物,现在已经不合时宜;杜威分类法的历史部分,把区域史按照地理复分,复分表把大洲和小地区并列;等等,我承认这些都是传统分类法的瑕疵,然而这些并不能否认传统分类法的作用和意义,而只能说明传统分类法在尽可能接近理性完美的同时不得不为了实用而作些让步。现在每个人都可以建立自己的分类法,技术的进步可以很好地管理这些分类法,然而至少不能说比前者更科学吧?

实际上Shirky列举的上述三个例子都可以通过本体的互操作来解决,苏联、东欧等概念作为数字资源生命周期中某个阶段的概念,完全可以通过时空本体建立起对应关系。提出这些问题只能说明作者的无知。大千世界本来就应该允许本体的多元,只要能解决本体之间的映射、参照等联系就可以了。为什么不能宽容一些,把元素周期表、中图法、地理复分表也当作某个特别的Folksonomy呢?皇帝一拉下马就要杀头,给个平民的身份怕他复辟?

Shirky很清楚,传统分类法是组织实体资源用的,因而一个资源不管多么复杂、多么“综合”,也只能归入一类,变通办法最多只能在相关类别建立参照关系,然而这是非常有限的,只能在“类”的层次,而不能任意联系。这不能作为诟病传统分类法的口实——对分类法的需求不同。Shirky不知道有没有听说分面分类的思想。数字资源则完全没有这个限制,一个资源可以由无数多个“指代物”,只要指向唯一ID就可以了。分类词(tag)是指代,主题词也是指代,通过主题词搜索到一篇文献与通过分类浏览到一篇文献没有本质区别,只是人们在具有明确查询需求时更喜欢用搜索的方式,而在需求不明确时才借助浏览方式。因而分类法逐渐退缩为后台支持的一种“扩充检索”、“族性检索”以及“联想”“推荐”“猜测用户需求”的功能,这种功能越来越多地被用于自动发现、个性化服务等方面。这就是说诸如Yahoo!之类的分类体系可以提供很好的浏览功能,Yahoo!很注意实用性,而不强调科学性,Shirky以不合逻辑来指责Yahoo!的分类体系是完全没有道理的,Folksonomy才常常只按照自己的逻辑分类,使别人根本无从理解。这种指责就像是衣衫褴褛的乞丐指责衣冠楚楚的绅士没有系好领带,还不如像乞丐那样破衣烂衫一样。

Shirky把链接关系和层次关系也看得绝对了,层次关系是一种特殊的链接关系,两者并非不能并存,两者甚至可以互补。现在就有人考虑给出了建立tag之间的联系之外,还可以增加层次关系。Shirky进而把本体的应用领域局限为领域、专家的应用,而把草根分类folksonomy归入大众、普及型的应用。殊不知本体是Semantic Web的基础,而Semantic Web并非只是“领域应用”。

Shirky演讲的第二部分(The Only Group That Can Categorize Everything Is Everybody)重点谈tagfolksonomy的应用,大体还是不错的,就像我前面说的,不乏真知灼见,值得一看,在这里就不复述了。

- 作者: kevenlw 2005年05月20日, 星期五 20:24 加入博采

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=1591952

回复

- 评论人:只说

Sun May 22 21:47:40 CST 2005  作者Blog

其实现在应用市场也谈“小众化机制”,我们谈标签是“小众的游戏”只是认为“tag和folksonomy”其社会化特性被高估了。

- 评论人:图谋

Sat May 21 12:03:16 CST 2005  作者Blog

呵呵,keven先生太幽默了。估计keven先生讲课很有意思。

- 评论人:happyscry

Fri May 20 22:13:44 CST 2005  作者Blog

看到本体这个词才进入这里,在企业信息建模领域似乎也流行起来了。原来这里还有一群专业的圈子,幸会幸会啊。

- 评论人:游园

Fri May 20 21:32:30 CST 2005  作者Blog

收了一直没有阅读,没想到keven先生已经写文回应了。
估计这位Shirky不是像keven先生一样是专业人士,所以对于我们传统的实体分类那么轻视。
不过,轻视归轻视,实体的分类法在未来还会是主流——也是实体最佳的分类依据了。
至于tag和folksonomy,热闹归热闹,但还是“小众的游戏”。

评论内容: