首页 | 博客群 | 公社 | 专栏 | 论坛 | 图片 | 资讯 | 注册 | 帮助 | 博客联播 | 随机访问
Dlib杂志十岁了- -| 回首页 | 2005年索引 | - -资源集合元数据方案的一些问题

关于Ontology的问题

关键词Ontology    本体    知识组织                                          

雨僧老师那边点名了,我也来试着回答一下老师的问题。

一、 与叙词表相比,O的语义表示功能改进有多大?

二、 O能实现完全的自然语言标引吗?

三、 O的成熟能带来自动标引的实现吗?(这一问题与第二个问题有关联)

四、 O方法能成为未来网络信息检索的发展方向吗?

五、 O理论能为知识组织理论带来革命性变化吗?

一、

1、 即使在计算机领域,Ontology(本体)也有许多涵义,如软件工程与人工智能中的Ontology就很有些区别。现在公认的Gruber的定义(formal, explicit specification of a shared conceptualisation)也可以有多种实现途径,W3COWL可以看成是一种实现,Topic Maps也是一种实现。在我看来,本体就是对事物的某种认识,这种认识可以以各种方式表达出来(即explicit外在性,被认为是知识学习、共享、交换、利用的必需),最简单最直接的方式就是以概念体系来表达,然而现在一般认为仅仅是词表及其简单的关系构成的概念体系是不够的,领域知识虽然无法穷尽表达(任何领域知识都不是一个闭包),然而本体应该能够提供一种方式,使人们能够关联、推演、判断这些知识,于是本体希望能够表达人类知识的各个方面,例如函数关系、逻辑推理等等,而现在人们使用的本体表达工具(包括传统的给人用的分类法、叙词表,以及现在给计算机用的OWL等)都具有不同的应用范围和表达能力。

2、 现在人们开发和使用的所有本体语言或表达工具,就语义表示(知识表达)来说实际上没有任何新的东西,现在所做的只是采用另一种形式对前些年的人工智能成果进行表示或“重现”,都是早已有的东西,例如现在比较多的是采用基于概念的一阶谓词逻辑,用框架逻辑(如Protege)或描述逻辑(如OWL)的形式来表达和演算,等等。但是发展到一定阶段,是否会有所突破就很难预料了,有时使用的工具和形式会决定学科的发展方向以及是否能够取得成果。

3、 OWL来说,其作用体现在形式化之后能够提供完全的计算机处理方面(即formal,形式化的要求),在语义表示能力方面也没有什么突破,但是就目前它的能力已经能做很多事情了。近年来本体之所以如此热门,主要还在于计算机能够通过它来管理大量的“形式化后的”知识,别小看这一点点的进步,应用于无所不在的互联网连接起来的海量知识能产生巨大的效果。

二、三、

目前我还看不出使用本体会对自然语言标引带来怎么大的帮助,是否自然语言标引之后,能够应用本体工具处理一下,马上就规范了?就像随便什么螃蟹在阳澄湖水里浸一下,就变成阳澄湖大闸蟹了,立刻可以身价数倍。

有了本体,如何实现本体的作用和功能,第一步就是Annotation,如何做,现在并没有比早就付诸应用的、利用工具实现“机助人工”更好的方法,但是计算机专家们一直没有放弃“自动”标注的幻想,希望在资源生成的时候,相应的语义元数据能够直接生成(这里涉及本体与元数据的关系,请参见本博客的其它相关文章1文章2文章3)。

另有一种认识:不要把本体看成是规范得不得了的东西。自然语言进行领域知识的标引,所形成的词表为什么不能是本体?照样可以应用本体工具实现一定的功能。一个信息系统经过用户大量使用之后许多概念能够自动归类、整序而成为可供别人使用的很好的本体,等等,本体的构建方法也可以是多种多样的。

本体的最大作用还在于机器与机器之间的达成的语义互操作,因而本体可以不是人用的,而纯粹是机器实现互操作功能的中间状态,例如以概率模型或向量模型表达的中间本体。

随着“全息”信息环境的建立和普及,人工“标引”的重要性和价值正在丧失。这种“全息”环境是指数字信息自从产生就带有作者背景、机构背景、内容/学科/领域背景(全文索引)、应用/用户背景等上下文信息(Context),这些信息不仅是人工标引难以企及的,而且是动态变化的。Google Pagerank用于排序的准确性几乎宣布了人工标引作用的彻底破产。当然这样一种“全息”环境还有赖于相关网络基础架构和信息生产/传播工具的支持和普及,其源头是人,其最终用户也是人,所以“人工”永远是最初的“肇始”和最终目的,本体等永远是工具,这一点到任何时候都是无法改变的。

四、

本体作为一种方法刚刚兴起,因此将会有一个发展、成熟、高潮时期,这个时期会随着语义Web的发展而逐渐强势。我本人十分看好本体方法,一个很强烈的理由是它有数学理论的支持(一阶谓词逻辑及其扩展)。当然如果最后证明语义Web也是一个与人工智能一样的大泡泡,本体方法当然也会沉寂下去。

本体是否作为未来信息检索的发展方向,不好说,它只是实现信息检索功能的一种工具,有特定的应用场合(就像倒排档对于信息检索的作用仅限于索引,当然这个例子比较狭隘,本体应该有更为广泛的应用空间)。将来的信息检索在信息系统的组织、提问式的处理、检索结果的呈现等方面将大量采用本体,这一点在我看来应该是毫无疑问的。

五、

知识组织如果说有理论的话,还是一种应用性的理论,如知识分类理论我并不觉得有多少理论性。本体对于知识组织的作用还是工具性的,而且这种工具是依附于计算机和网络的,是由于计算机技术的发展和网络规模的发展而带来的,可能对于未来的知识组织实践会产生一个根本性的改观,成为将来知识组织不能不考虑的一种方法,将来的教材也会不厌其烦地讨论本体方法及其实现,但是这是革命性的吗?我好像看不出。本体,本来就在那里的实体,爪哇国人向不食螃蟹,有朋自中国来,大啖螃蟹,味美之,于是食螃蟹。有何稀奇?

【作者: kevenlw】【访问统计:】【2005年07月21日 星期四 17:12】【注册】【打印

搜索

Google

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=2342689

来自逐鹿流行榜逐鹿流行榜的引用:

逐鹿流行榜

博客手拉手

Ontology是什么?
Ontology是什么?
Ontology是什么?
Ontology是什么?
Ontology是什么?

回复

- 评论人:小白   2009-02-07 23:20:49   

1 你好,现在通过下面链接可以备份您的博客: http://home.myspace.cn/blogmove.aspx 快去看看^_^ bokee.com 78395

- 评论人:a   2005-07-22 22:48:13   

"就像随便什么螃蟹在阳澄湖水里浸一下,就变成阳澄湖大闸蟹了,立刻可以身价数倍。"呵呵,这句大家都看的懂。@_@

- 评论人:雨僧   2005-07-21 20:38:27   

好一个“一阶谓词逻辑及其扩展”!Keven兄如果利用一阶谓词逻辑及其扩展来建立抽象图书馆学,将比叶教授用微分方程建立的抽象图书馆学有价值得多。

验证码:   
评论内容: