这是一篇旧作中的文字。
数字图书馆不是Web,但是数字图书馆根植于Web,起码现在看起来如此。Web通过URL定位服务器地址,通过超文本传输协议http将html文件连接成一张大网,通过MIME协议把各类文件交给客户端自行处理,通过CGI、SQL提供结构化数据的发布,通过ASP、JSP等实现动态管理和更多功能。然而人们希望Web是大型连锁超市而不是杂货铺。人们希望Web这张大网直接连接数字资源而无需通过服务器地址,于是引入统一资源名URN系统(RFCs 2141 & 2168);人们希望html文件能蕴含更多的“结构”和“关系”,而不仅仅是关于显示和链接,于是引入了XML;人们希望电脑能够“读懂”XML中的特定内容,在人们得到信息之前,机器之间已经进行了成千上万次交互,经过选择、匹配、汇总、过滤,把人们真正想要的东西,按照人们想要的形式呈现出来,于是引入了RDF,一种资源描述语法,以及OWL,一种知识本体的定义语言。
数字图书馆是一个交叉研究领域,目的是解决分布式环境下的数字资源对象的组织、访问和服务问题。为此必须在微观上定义数字对象的组织结构,在宏观上解决信息仓储的组织问题,同时允许这种结构与资源的语义内容分离,支持独立或分层的索引、馆藏(collection)、名称、仓储(repository)、网关、用户界面等服务。
Kahn和Wilensky在奠定数字图书馆概念基础的论文[i]中阐述了数字对象的微观结构,认为数字对象由数据和键元数据组成,键元数据中最重要的是句柄,句柄系统构成数字图书馆宏观结构的基础,数字对象的句柄解析是数字图书馆的最基本的服务。在这个结构中作者没有进一步讨论元数据的组成和结构。后来Bill Arms等人对这个结构进行了较为详细地解释[ii][iii]。为了具体应用,Cornell大学曾以Warwick框架诠释这个结构[iv],使之成为能够动态表达元数据与数据之间关系(DAR: Distributed Active Relationship)的模型,后具体应用到该校的FEDORA方案中,初步设计了满足互操作、永久保存、版权管理等功能的对象包结构——“篮子(bucket)”,并影响到目前正在进行中的Prism、OAI等项目。
现实的网络世界中数字资源以各种各样的形式存在,数字图书馆必须首先确立基本组成单位的逻辑结构,把万千变化的数字资源包裹成数字仓储中具有特定结构的数字对象,才能为数字图书馆所管理和利用。数字图书馆的每一项功能,在数字对象的结构中都隐藏有特定的“基因”,不可能存在例外。由于目前的现实系统复杂多样,造成数字图书馆宏观结构的丰富多彩。一个灵活、清晰的数据模型和系统结构决定了数字图书馆的普适性、可扩展性、互操作性和运行效率。
从宏观上看,数字图书馆类似于建筑在各类系统之上的,由众多高层协议中间件构成的服务系统。用户访问网关负责向用户提供查询界面,处理用户的提问,然后将用户的提问进行语义规范和语法转换,选择合适的馆藏服务,并对返回的命中根据相关性、资源类型、数据格式等进行过滤、排序或做其他显示处理,整个服务过程无不依赖元数据。馆藏服务提供虚拟馆藏揭示和浏览,可动态提供数字图书馆的用户视图,集中体现了数字图书馆的信息整合与服务整合功能。虚拟馆藏一般是基于知识内容进行组织,离不开对于资源内容进行描述的元数据方案以及建立在这种方案之上、定义规范语义之间相互联系的“知识本体”。索引服务直接对元数据进行索引,有时高层索引服务可以很简单,可以作为实现库存取协议RAP的一部分,与句柄服务同时提供,支持动态映射和分布式访问,而将复杂和特殊的元数据索引传递给各资源库或自治站点自行解决。理想的资源库(repository)服务很简单,提供满足数字图书馆微观结构的数字对象“包”的逻辑存储,可以由RAP进行调用即可。然而现实世界中这一块最复杂,其物理实现暂且不说,如何将目前互联网上的异构的、复杂多样的资源以一种灵活的、可扩展的形式“打包”成数字图书馆的资源库,是一件颇费思量的事情,这其中的核心问题就是互操作问题,而互操作问题在很大程度上必须通过适当的元数据方案来解决,目前有许多实验系统专注于解决这个现实问题,这个问题不解决,数字图书馆很可能成为空中楼阁,或互联网上的另一类孤立系统。
随着XML、RDF等新技术的成熟和普及,人们对技术发展趋势的把握比数字图书馆刚刚提出的近十年前要准确的多,对需要解决的问题和解决问题的方法也有更清晰地认识,这种认识往往更简单一些。简单性对于数字图书馆来说其重要性常常不亚于开放性。早期DLI1(数字图书馆先导研究计划第一期)的一些项目如果放在今天的技术背景下进行研究开发,应该能够更加实用,并更有成效。DLI2继续资助的一些项目已经结出了丰硕的成果,不管是从技术上进行的探索还是在网上已经提供服务的一些实验系统,例如SMETE、NCSTRL、CDL、OAI等。
斯坦福大学的Infobus方案并不关心数字对象是否遵循Kahn/Welinsky结构,只专注于实现异构系统的互操作,提出了多达5层的独立服务:互操作层DLIOP、元数据结构层SMA、搜索协议层STARTS、通用支付接口UPAI和可互操作的权限管理框架FIRM,为在现有技术环境下实现数字图书馆进行了全面的探索,提供了一整套复杂的模型,这些模型是否能够得到很好的应用尚属未知数,但其中的许多思想影响着以后的很多项目。
康乃尔大学虽然没有在DLI1项目中主持项目,但其对于体系结构的研究也同样著名,由其主导、数十个研究机构参与开发的OAI体系结构是目前最具开放性和可操作性的数字图书馆模型,它重新设计了数字图书馆资源采集、获取、组织、发布、检索的应用流程,专注于建立站点之间共享元数据和资源内容的机制,定义了“数据提供”和“服务提供”两类角色,省略了很多难以控制和管理的技术细节,在某种程度上可以看成是数字图书馆时代的Z39.50协议。你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=2211414
|
- 评论人:Jessica
2009-02-07 23:23:36
|
|||
4 你好,现在通过下面链接可以备份您的博客: http://home.myspace.cn/blogmove.aspx 快去看看^_^ bokee.com 78395 |
||||
|
- 评论人:Y
2005-07-10 16:48:52
|
|||
经典! |
||||