关于作者

用户名:kevenlw
笔名:kevenlw
地区:
行业:其他

日历  

快速登录

+ 用户名:
+ 密 码:

在线留言



左邻右舍

远房亲戚

娘家串门

访问数据

Razor Phone
Razor Phone

图片照片

www.flickr.com
This is a Flickr badge showing public photos from kevenlw. Make your own badge here.

访问统计:
文章个数:169
评论个数:578
留言条数:18




Powered by BlogDriver 2.1

数图研究笔记

 

文章

拆迁告示  (作者置顶)
Google
搜索WWW 搜索meta.blogchina.com




本博客迁往地址:http://www.kevenlw.name/

- 作者: kevenlw 2005年10月28日, 星期五 16:59  回复(0) |  引用(1) 加入博采

以下内容来自http://www.kevenlw.name/  (作者置顶)

- 作者: kevenlw 2005年10月17日, 星期一 11:18  回复(0) |  引用(1) 加入博采

关于语义架构的一些思考题  (作者置顶)



一些问题正在思考中,先简单汇总在此。
  • 语义互操作是什么?究竟要解决什么问题?语义功能要实现哪些服务?
  • 技术实现环境问题:为什么要采用基于Web Services的架构解决数字图书馆语义互操作问题?而不采用基于CORBA或其它中间件技术?
  • 建模问题:能够提出一个既灵活又相对稳定、能够得到公认的数字图书馆信息资源组织与查询模式/模型,并能为Web Services技术所支持吗?(参考5S模型、生命周期模型、子商务模型、OAIS模型、情报检索模型等)
  • 体系架构问题:采用Web Services(UDDI/WSDL)技术实现语义功能有什么问题吗?与Semantic Web Services有何异同?是否能实现服务发现、流程组配选优等功能?(Web Services实现ISO11179有可能吗?)
  • 可行性/优化问题:是否有尽可能多的、足够简单的方法,或者设想出不需要人工进行很多参与的方法(例如自动提取、相关反馈、启发式算法等),实现语义功能?
  • 什么是信息系统的语义架构?包含哪些内容?
  • 本体在其中起什么作用?如何起作用?
  • 元数据在其中起什么作用?如何起作用?
  • 元数据与本体的关系是什么?
  • 如何形式化地描述上述问题?论证上述问题?寻找上述问题的边界和特例?提出本论文的创新之处?

- 作者: kevenlw 2005年07月12日, 星期二 00:28  回复(2) |  引用(1) 加入博采

呼唤数字图书馆的“统一场”理论  (作者置顶)

数字图书馆需要整合。不是说某一个数字图书馆的资源,或者服务需要整合,而是数字图书馆的研究内容需要整合。

记得七、八年前我们刚接 触数字图书馆的时候,被其"博大精深",或者说"混乱无序"弄得非常沮丧。除了一些零散项目、计划的举例,不知道如何认识、怎样下手。好不容易提出了"三 种数字图书馆":即来自计算机界的研究开发、来自各类机构的服务体系建设和纯粹的数字化,又觉得分类很粗,缺乏逻辑,无法反映数字图书馆内在的体系结构和 本质联系。

在美国虽数字图书馆的支持接近尾声之际,似乎到来了数字图书馆总结之时(NSF的"后数字图书馆时代"的提法颇有些对数字图书馆进行"清算"的味道,见"鳕鱼岬会议"博客文章。在对2002年以来的数次数字图书馆"峰会"(指以回顾展望为主题的管理型的工作会议,如NSF/DELOS的一些会议。99年也曾召开过一些)进行认真学习之后,突然感到数字图书馆的"学科体系"似乎已然建立,从Fox等人的5S基础理论(LeonWitten调侃其为"五行学说")以及SFX的发明人Sompel呼吁数字图书馆基础理论建立的必要性,一直到NSDLCDL以及LoC实打实的建设,以及从技术角度Digital LibrarySemantic Web的联姻,并共同迎接Cyberinfrastructure的挑战。数字图书馆的社会性、人文性、技术性正在融合,站得高一点,打破学科之间的固有樊篱,整个图景会变得越来越清晰。本人很想就数字图书馆建立"统一场理论"作一些研究。目前可资借鉴的报告就有如下数篇(名称凭记忆列出):

  1. Daniel E. AtkinsCyberinfrastructure
  2. NSF鳕鱼岬会议的Knowledge Lost in Information
  3. OCLCEnvironmental Scanning
  4. 信息技术:投资我们的未来
  5. 数字图书馆:对人类知识的普遍访问

当然这项研究需要理论与实践的结合,需要不同"粒度"的研究,需要技术与人文的对话。尤其重要的,是需要一个崭新的视角、宽广的视野和突破传统的勇气。这些都不是靠个人的力量所能达到的,需要一个团队,一批人共同的努力。无奈的是国内这个圈子的人太少了。



- 作者: kevenlw 2005年02月28日, 星期一 09:26  回复(18) |  引用(1) 加入博采

学习“语义网格”
摘要:虽然在Ian Foster和Carl Kesselman的书中几乎对Jeffery等人的网格分层观点几乎持否定态度,然而认为网格可以分为数据、信息和知识三层并将这种想法付诸R&D实施的大有人在。 Ian和Carl认为这个观点有其局限性,“通常计算、数据和知识是彼此不可分割的,特别是知识不仅驻留在网格应用中,而且也渗透到网格应用和基础框架的全部有效范围内。”(作者认为一种更准确的体系结构应该是基于组件的,其中的各种宏组件协同工作)。 我的想法也是基于这样一种分层模型进行,我认为如果把看成对象的信息、数据、知识(Semantic on the grid)与系统架构和实现所需要的“信息、数据和知识”(semantic for/in the grid)分开来讨论,这种分层架构完全是能够成立的。但是这个观点还没有进行证明,我目前还没有很好的形式化的方法能够对这一点加以证明,也还没有看到那些采用分层观点的系统事先进行过证明。 查看全文

- 作者: kevenlw 2005年08月1日, 星期一 01:39  回复(7) |  引用(1) 加入博采

学习《网格计算》
摘要:不破不立,破了要立,前几天说了网格不少坏话,今天要说说它的好话。实际上网格还算是一个非常不错的好东西,至少目前画的大饼还是够大够圆的,能实现多少当然另当别论。思想这种东西即使没有实现也不会浪费,还可以被众多的后继项目所利用。计算机学科发展的有很多这样的例子。OSI七层协议好不好?好!有没有人用?没人用!起没起到作用?作用是大大地。看罢Ian Foster和Carl Kesselman的《网格计算》,里面有好些东西让我想到OSI网络结构7层模型。 查看全文

- 作者: kevenlw 2005年07月30日, 星期六 10:38  回复(1) |  引用(1) 加入博采

再议狐狸先生的数字图书馆五行学说
摘要:雨僧先生推荐的狐狸先生的5S模型,是我数年来一直关注的,其间还跟他见过两次面,大大地把这个中西结合的学说(即数字图书馆的金木水火土5行学说)夸奖了一番,他也对能有此比颇为得意。然而说实在话最初接触这个学说的时候感到简直在扯淡。没想到一个扯淡的学说在认真的计算机专家那里可以上升到到如此的严格和规范的高度(同样扯淡的还有DC最初的12个元素),看来人只要认真起来,学问在哪里都可以长出来。这里又要为我们的图书馆学惭愧一把了,老槐说图基是亢龙有悔,悔就是反思,99.99%地悔,我感到我们是回回悔、悔之又悔、后悔去悔、死不改悔,陷入了怪圈,最后落得没有建设,只有后悔了。 查看全文

- 作者: kevenlw 2005年07月29日, 星期五 22:01  回复(2) |  引用(1) 加入博采

一些专业词汇的两岸翻译
摘要:metadata 元数据 诠释资料/後設資料 attribute 属性 栏位 file 文件 档案 data 数据 资料...... 查看全文

- 作者: kevenlw 2005年07月28日, 星期四 20:27  回复(7) |  引用(73) 加入博采

学习网格(续)
摘要:很早就想“谈谈网格”,然而这个题目实在有些啃不动,只好继续叫“学习网格”。一直感到 “网格”可能是第五代计算机(人工智能)以来最大的泡泡了,起码比“数字图书馆”大多了,然而令人不解的是网格的确有那么多科学家大腕相信它,虽然雾里看花它的确是个非常非常好的东东,但是网格从还没有Web就开始起步,具体指什么却一改再改,近年来却与小弟弟W3C打得火热,窃取了Web Service甚至Semantic Web的一整套技术标准和方案,而且居然说网格是建立在因特网之上,又独立于因特网的应用平台,也有人干脆说下一代因特网就是网格,乖乖,连T.B.李爵士都不敢说Semantic Web(语义万维网)会取代Web。 查看全文

- 作者: kevenlw 2005年07月26日, 星期二 23:06  回复(8) |  引用(1) 加入博采

软件开发项目评分表
摘要:有时很难评判软件公司开发方案,采用专家评分方法可以“显得"比较客观公允,主管部门也可以据此“免责”。当然任何程序都有“误导”和“利用”的可能,不是绝对的。在这里贴出我们常用的一个评分表,供大家参考,如果有高见也请指出,在此谢过了! 查看全文

- 作者: kevenlw 2005年07月25日, 星期一 23:23  回复(0) |  引用(1) 加入博采

资源集合元数据方案的一些问题
摘要:看到Pete给Partrick的一封信中讨论了一些我们一直在争论和困惑的问题,写在这里留存。 查看全文

- 作者: kevenlw 2005年07月23日, 星期六 00:01  回复(4) |  引用(2) 加入博采

关于Ontology的问题
摘要:雨僧老师那边点名了,我也来试着回答一下蒋老师的问题。 查看全文

- 作者: kevenlw 2005年07月21日, 星期四 17:12  回复(2) |  引用(1) 加入博采

Dlib杂志十岁了
摘要:到本期(7/8月号)数字图书馆杂志(http://www.dlib.org/)正好10周年了。联想到前不久W3C庆祝十周年,让人感到时间过得真快,也真不可思议。许多影响我们生活方式的东西好像一直在那里,但实际上只有很短的历史,现在几乎很难想象没有互联网的生活,再溯及以往,没有电视、广播,甚至没有电的生活。工业文明才过去一个世纪,而信息文明才过去10年,才十年!就像老槐感叹的,人的一年相当于狗的七年,“网络年”应该比“狗年”过得更快吧。 查看全文

- 作者: kevenlw 2005年07月20日, 星期三 06:50  回复(3) |  引用(1) 加入博采

PREMIS元数据
摘要:这套方案应该会对图书馆界的数字图书馆项目产生重大影响。然而这套方案与DC有很大的不同,一是比DC详细得多,二是并没有以DC作为核心集(它自己到提出一个核心集的概念),当然PREMIS到DC的映射也是很好做的,三是它的元素是有层次结构的(现在看起来最多到四层)。我的感觉它是把OAIS模型具体化和规范化了,对OAIS涉及到的各方面属性元素都进行了定义,定义的基础又不是从DC的扩展,因而与国图提出的《中文元数据方案》有很大区别。 其中有很多思想值得借鉴。例如对于数字对象关系的分类,对于Event资源类型的属性集的提出,对四类实体的Schema定义等等。在相关的讨论组里还讨论了数据元素嵌入METS应用的问题。 查看全文

- 作者: kevenlw 2005年07月19日, 星期二 09:22  回复(0) |  引用(1) 加入博采

Web n.0
摘要:从语义Web发展的角度,似乎web的版本可以这样定义。 查看全文

- 作者: kevenlw 2005年07月19日, 星期二 06:07  回复(0) |  引用(1) 加入博采

名人名言
摘要:下面是本人曾经在“博客介绍”栏目中用过的"名人名言",汇总在此。 查看全文

- 作者: kevenlw 2005年07月18日, 星期一 07:09  回复(9) |  引用(1) 加入博采

学习“网格”
摘要:网格的概念这两年在国内计算机界一下子升温,犹如图书馆界的数字图书馆,什么科学计算网格、语义网格、文化网格、地区(中国、上海)网格,又涌现出一大批专家(首席科学家、首席教授),如诸葛海、金海、李明禄等等,去年由于领导对网格有兴趣,作了初步的了解,发现网格概念在国内科普多于科研,宣传多于工程,项目倒是列了不少,科研投资力度比当年数字图书馆大多了。可能有意义的论著我还没有看到吧。在国外与Cyberinfrastructure和e-Science等大型基础设施构建联系密切,与Semantic Web/Web Service以及SOA的关系也很密切。买了一本Ian Foster的《网格计算(第二版)》(翻译版)在看。Chinapub网上对中译版骂声不绝,在我购买时犹豫了很久,到底买影印版还是中文版,后来还是为了“速读”买了中文版,不像评论中说的那么惨,大多数带问号的地方还是可以猜出来的,但是“速读”还是成了一种奢望。这本书写得不错,内容非常丰富,可以说把很多技术和应用串起来了。 查看全文

- 作者: kevenlw 2005年07月17日, 星期日 06:49  回复(4) |  引用(1) 加入博采

再读OCLC2003环境扫描报告
摘要:这份报告的重要性首先来自于这份报告产生的背景。这是一个“图书馆公司”对其生存环境的扫描,这个图书馆公司是一个行业的代表——几乎是唯一的代表,背后获得整个行业(虽然不是全部)的支持,可以说没有这个行业就没有这个公司,但是是不是没有这个公司就没有这个行业的未来呢?当然谁也没有这么说,但是应该说影响还是蛮大的。从东到西,从富到穷,这个行业由于特殊的体制困境在信息化和市场化当中的命运“危如累卵”,它比任何个体图书馆对于信息技术的侵害都具有警觉性,它也是最有能力带领这个行业合纵连横,冲出一条血路的真命天子,于是,这份报告就这么出炉了。在平和的语言和纷杂的事实罗列背后暗藏着绝地反击的玄机。当然,并不是说它已经准备好了,但是它已经开始出击,与Yahoo!/Google的合作是一种试探,DC元数据是深入未来Web应用的一根毒刺,投身于开源运动是一种积极应战的姿态…… 查看全文

- 作者: kevenlw 2005年07月15日, 星期五 07:54  回复(5) |  引用(1) 加入博采

张晓林:只有元数据能救数字图书馆?
摘要:完整全面的标准规范对于数字图书馆建设无疑具有非常重要的意义。然而在目前我国数字图书馆建设所面临的“技术”、“法规”和“式”三大难题当中,技术因素却是比较容易解决和相对次要的。而且仅就技术问题而言,不同的模型所提供的视角不同,所归纳整理的问题也不同,特别对于发展迅速的IT应用来说,标准规范实在只是个相对的、应该退居后台的东西。目前国内数字图书馆应用真正需要的,是集成了各类标准规范在内的、直接面向应用的解决方案,而绝不是那些号称提供“数字图书馆解决方案”的计算机公司所提供的那些混淆视听的东西。技术问题从来都不应该是图书馆员们操心的内容,但是如果图书馆员不尽早参与,数字图书馆是不会成功的,美国对DLI研发历史的反思就说明了这一点。而我们的情况正好相反:只有图书馆员关心数字图书馆。这就给我们这个行业的张晓林们提出了一个课题,应该由图书馆界来主导数字图书馆发展的潮流,提供需求,参与解决方案的研发,而不是由计算机界或者企业界主导。图书馆界需要标准规范,但是远不止这些。 查看全文

- 作者: kevenlw 2005年07月14日, 星期四 19:27  回复(7) |  引用(1) 加入博采

图书馆IT业务外包的ASP服务模式
摘要:多年前在IT行业的各种商务模式很热的时候,曾设想过图书馆IT业务的ASP外包方式,写了一些笔记,不过都是纸上谈兵,现在也没人说ASP了,呵呵 查看全文

- 作者: kevenlw 2005年07月13日, 星期三 07:27  回复(2) |  引用(12) 加入博采

图书馆项目管理的模式和方法
摘要:这是我的同事刘年娣老师参加项目管理培训的一篇习作的一部分,看看很有道理。现在许多图书馆IT开发都“号称”采用项目管理,但是很少是真正的项目管理,且项目管理与大多数图书馆作为事业单位的管理方式和管理理念是相冲突的。 查看全文

- 作者: kevenlw 2005年07月11日, 星期一 00:57  回复(5) |  引用(1) 加入博采

数图资源订购技术需求
摘要:根据加州数字图书馆数字资源采订技术需求编译。 查看全文

- 作者: kevenlw 2005年07月10日, 星期日 08:17  回复(3) |  引用(1) 加入博采

关于数图体系结构(三)
摘要:数字图书馆不是Web,但是数字图书馆根植于Web,起码现在看起来如此。Web通过URL定位服务器地址,通过超文本传输协议http将html文件连接成一张大网,通过MIME协议把各类文件交给客户端自行处理,通过CGI、SQL提供结构化数据的发布,通过ASP、JSP等实现动态管理和更多功能。然而人们希望Web是大型连锁超市而不是杂货铺。人们希望Web这张大网直接连接数字资源而无需通过服务器地址,于是引入统一资源名URN系统(RFCs 2141 & 2168);人们希望html文件能蕴含更多的“结构”和“关系”,而不仅仅是关于显示和链接,于是引入了XML;人们希望电脑能够“读懂”XML中的特定内容,在人们得到信息之前,机器之间已经进行了成千上万次交互,经过选择、匹配、汇总、过滤,把人们真正想要的东西,按照人们想要的形式呈现出来,于是引入了RDF,一种资源描述语法,以及OWL,一种知识本体的定义语言。 查看全文

- 作者: kevenlw 2005年07月9日, 星期六 00:05  回复(1) |  引用(1) 加入博采

Google与数字图书馆(下)
摘要:Google在短短的时间内推出了许多独门武功,一时间使人们对其锦囊充满了好奇与期待。......与其把Google看成图书馆的竞争者,不如看成合作者。随着数字时代的全面到来,对以传统文献为主要资源的图书馆服务的需求必然越来越少,图书馆一方面需要采集、整合更多的数字资源,转型为数字图书馆,另一方面也需要与数字信息生命周期中各相关责任实体协同,这些实体构成的整个行业生态如下图所示。此时产生的各类数字图书馆的形态可能与传统的完全不同,甚至会出现无馆藏的数字图书馆,仅仅依靠虚拟馆藏提供门户服务。因此将Google的某些服务看成数字图书馆,好像并没有什么不妥。而且相反,图书馆行业也可以更多地向Google们学习网络服务技巧和模式。 查看全文

- 作者: kevenlw 2005年07月8日, 星期五 01:30  回复(7) |  引用(1) 加入博采

Google与数字图书馆(上)
摘要:2004年6月21日的纽约时报登出一篇专栏文章“Google阴影笼罩下的传统图书馆业”,报道了搜索引擎给图书馆行业造成的实实在在的冲击。多项业界调查表明,图书馆的信息环境正在发生变化,搜索引擎正在取代图书馆从前在社会知识交流中的角色,成为连接出版发行商和信息用户的中介。当搜索引擎利用数字图书馆的研发成果逐步触及“深层”Web的时候,当越来越多的人习惯于通过Google、Yahoo获取信息,而不再“麻烦”图书馆时,图书馆恐怕只能放下架子,抛开视而不见的“鸵鸟政策”和自我安慰的“阿Q精神”,以“数字图书馆”的其人之矛,攻其人之盾了。当然攻不攻得过是另外一回事。如果打不过也逃不了,还有一条路——可以合作。 查看全文

- 作者: kevenlw 2005年07月7日, 星期四 18:59  回复(4) |  引用(1) 加入博采

秦健:建立为数据库信息服务的知识网
摘要:参加在杭州举办的“长三角数字图书馆技术与规范”高级研讨班的同事带回来一些ppt文件给我们学习。今天学了秦健的《建立为数据库信息服务的知识网》,并随手作了一些笔记如下(带背景色的为原文,仅摘录了认为较有启发的一些Slides)。 查看全文

- 作者: kevenlw 2005年07月6日, 星期三 20:23  回复(3) |  引用(1) 加入博采

盗版与“盗”德
摘要:几天前把盗版与道德联系起来,引起了诸多义愤,也映证了林语堂先生的告知:中国人不怕犯法,倒怕缺德。犯法多不过碗大个疤,老子依旧好汉,而缺德事关祖宗八代,被人啐了当下也脸上挂不住。其实大可不必,做盗版的人在那里数钱窃笑,买盗版的却已在窝里开打,面红耳赤而不可开交了。 说盗版最大的危害在道德,大伙儿就争先恐后把缺德的帽子往头上戴,然后反过来假设你也不干净,所以更可耻!至于吗?!老夫敬佩哥们够胜总,后现代,敢做敢为,说了句响当当的“偷了你,又如何”,就想把黑的漂白了,可能吗?!这是强盗逻辑。 查看全文

- 作者: kevenlw 2005年07月5日, 星期二 01:02  回复(9) |  引用(2) 加入博采

Fox先生的数字图书馆5S模型
摘要:尽管谁都说不清数字图书馆是什么东西,但Virginia Tech大学的Edward Fox先生一直执意地为数字图书馆寻找理论基础——当然是从计算机科学的角度,以计算机科学的方法论进行。十多年来可以说成果斐然(位列数字图书馆全球十大专家毫不为过),不论大家是否公认他的5S理论,至少他已经搞出了一个十分完整的模型,在DL领域具有很高的成熟度(多年来矢志不渝,而且他是个非常勤奋的人),一路上还参与了许多著名的项目(如OAI/NSDL等),完成了很多数字图书馆系统的开发(著名的有ETD、CITIDEL、NDLTD、ArchDL、EPrints等——狐狸先生主持和参与的项目缩写多得一塌糊涂,且很难记住),带出了非常多的硕士博士(其中有不少中国人),并且最早提出了ODL(开放数字图书馆)和UDL(联合DL)的概念。......不论Fox先生的这种模型是不是实用,仅就其对数字图书馆一般规律的不懈追求,提出了一整套方法,其对于数字图书馆的抽象和理解,也值得我们好好学习和探究。 查看全文

- 作者: kevenlw 2005年07月3日, 星期日 22:50  回复(12) |  引用(1) 加入博采

关于MDA(Model Driven Architecture)
摘要:MDA与数字图书馆什么关系?MDA提供了开发分布式应用的一个很好的方法和平台,其思想和理念正是数字图书馆所需要的,数字图书馆只不过是其海量信息管理和检索方面的一个应用罢了。特别是在体系结构方面,如果我们可以探索出几种数字图书馆的应用模型(例如Fox教授倡导了十年的5S理论模型),组件化的数字图书馆集成管理系统岂不是水到渠成? 查看全文

- 作者: kevenlw 2005年07月1日, 星期五 12:55  回复(0) |  引用(1) 加入博采

计算机“语义”与知识
摘要:数字图书馆的诞生恰逢其时,语义Web技术正日趋成熟。语义是知识的基础,语义是对机器而言的,而知识是对人来说的。计算机如果不能处理语义,那么基于分布式数字图书馆体系实际上是无法真正达成的,人就无法通过诺大的因特网,获取自己想要的知识。 查看全文

- 作者: kevenlw 2005年06月30日, 星期四 07:29  回复(13) |  引用(71) 加入博采