与石馆长谈数字图书馆建设- -| 回首页 | 2005年索引 | - -一路走来,一路走好

支持多Schema的元数据著录工具- -

                                      

既然有人对这个东西感兴趣,手头正好有一篇介绍,转贴在此,给大伙做个参考。该系统没有开放互联网访问,所以无法提供试用,非常抱歉。这篇介绍文章的作者是上海图书馆数字图书馆研究所的张春景,文章写于今年年初,目前软件的界面已有所变化,与下面的贴图不完全一致。本文尚未投稿,如果有哪份杂志的编辑感到还可以而有兴趣的话,可来函告知(kevenlw@gmail.com或kevenlw@msn.com,最近gmail好像又不太正常了),我们可以修改后刊发。这个开发项目是由上图系统网络中心的赵亮老师和本人负责,张春景和楼向英参与,软件的版权属于上海图书馆,在此特别申明。

名人手稿馆元数据著录系统简介

名人手稿馆元数据著录系统项目于20045月开始启动,一边研究一边开发,数据加工也同期开展,而确定元数据方案和元数据加工管理的功能需求是该系统开发的核心工作。 基于此系统的重点在对馆藏内容的揭示,元数据方案的广度和深度方面有较高要求,因此元数据元素及其修饰词和编码体系的设定和配置是方案的难点,项目的设计、开发和使用者如果不能就这个方面尽快达成一致,必然会影响到系统的开发进度。事实证明在整个开发过程中研究开发与应用实施是互相牵制而又互相促进的。

名人手稿馆著录系统分著录流程和管理流程两个部分。著录为WEB方式,属浏览器/服务器结构(B/S);系统后台采用SQL Server关系型数据库为管理系统,前端采用WEB服务器加JSP方式的应用模式,同时辅之以JAVA开发的系统工具程序,构成一个完整的支持多种元数据应用规范的联机元数据著录系统。著录系统的客户端为标准的浏览器,考虑到多种元数据应用规范维护上的复杂性,元数据方案的配置、维护模块,采用专用的客户端软件形式。

由于此项目的定位是不仅要满足对名人手稿馆现有十三种资源的著录,而且可以满足将来上海图书馆所有资源的著录。基于这个目标,名人手稿馆著录系统中有一个重要的模块:元数据模式(Metadata Schema,指经过XMLRDF等形式化语言编码的元数据方案)的管理工具,此工具可以支持任意多种元数据方案,支持对任意多种资源的著录。因此使用此工具不仅可以任意增加元素和修饰词,任意配置不同元素组成的多个组,任意添加索引字段,还能支持元素和组之间的任意排序。而针对每个元素可以规定其上级元素,可以添加元素的默认值,可以规定元素属于字符串还是长文本,可以规定元素是否必备,规定元素在某个数量区域内重复添加,并且可以指定该元素是否连接人名规范档,是否给读者浏览的权限,等等。

利用此工具还可以实现元数据模式的导入导出,通过元数据模式导入功能把一个XML/RDF Schema导入到能够进行Schema转换的功能模块中,以便与元数据著录、存储进行映射;对导入的元数据模式 进行系统设定,在导入元数据模式的基础上设定其他参数,并转换成系统内部元数据存储、元数据著录等操作相关的数据结构及其他内容;还可以进行系统中元数据模式的格式转换,并且可选择同时导出与XML schema相关联的数据。

下图为名人手稿馆著录系统的schema管理工具的配置界面。
图一

schema管理工具对某种资源的元数据方案进行配置以后,还需要对元数据方案中所涉及到的编码体系进行配置。在本项目中,为了便于管理,将值列表和编码体系用统一的模式进行管理。由于系统支持任意多个schema的配置,从而导致scheme和值列表必定是不断增加的,并且对应于一个元素,可能有多种编码体系和值列表对其进行修饰,每一种编码体系和值列表都有自己的数据验证方式,因此名人手稿馆著录系统的编码体系管理可以实现对scheme和值列表的手工添加、修改、删除、查找等功能。

下图为编码体系管理的系统界面。
图二

schema管理工具和编码体系管理中对某种资源的元数据方案进行配置以后,就可以利用著录界面进行著录了,在系统的整个著录过程中,除了提供主要进行著录的著录界面功能以外,还提供了“编目树”功能,如果要全屏显示著录界面,可以将该编目树关闭。

在著录界面中,用红色星号显示了必须著录的必备字段,否则无法保存,并且还提供任何字段的无限重复添加,字段的删除,字段的成组添加,成组删除功能,对于著录人名的字段,可以直接将其著录内容链接到人名规范档。著录工作结束后,系统提供保存和临时保存功能,点击临时保存,则该条记录存入临时库,经校对人员校对后正式保存入库。系统在此还提供工作单的载入功能和对整条记录的密级管理的功能。系统中的编目树功能,可以提供点击编目树的任何一个字段,系统就将此字段添加到著录界面中的相应的元素下方,而且该编目树还可以反应该资源的元数据方案元素和修饰词,元素和编码体系修饰词之间的层级关系。

下图为著录界面


名人手稿馆著录系统作为一个专门管理各种名人资 源而开发的系统,具有其独特性,名人和名人之间,名人和资源之间,具有复杂的关系。因此需要提供一种在名人与资源间的浏览功能,即名人导航功能。名人导航 界面主要分三大块,分别是:“当前人物”,“关系人”和“与当前人物相关的资源”。系统在此提供两大功能,第一:系统首先在界面的导航栏显示名人手稿馆中 的重要名人,点击任何一个名人姓名后,该名人成为“当前人物”,并显示和其有关系的其他名人及和相关资源。当前人物除了能浏览界面提供的规范名,职衔,小 传,点击当前人物的规范名可以对整条规范档数据进行浏览,并提供当前人物的大头照。也可以点击与该名人有关系的其他名人,并以被选择的名人作为一个基准点 进行下一步的信息显示;点击相关资源的题名时,则显示资源中的详细内容。第二:界面提供用于人名检索的检索框,进行检索后,页面显示该名人及其与该名人有 关的其他名人和资源的关系图。此后的操作与第一项功能相同。这样可以层层叠套,将名人手稿馆的整个资源囊括和串联起来,形成名人手稿馆信息系统的一个特 点。

面单员一个元素,它可能有几

- 作者: kevenlw 访问统计: 2005年06月16日, 星期四 20:36 加入博采

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=1947822

回复

- 评论人:kevenlw

Fri Jun 17 20:28:38 CST 2005  作者Blog

XMLS是用来编码元数据方案的,其优点也就体现在“标准”性上。因为现在大家都用它定义XML文档格式。DCMI更推荐采用RDF/RDFS来定义,认为定义能力更强。当然你也可以用DTD来定义元数据方案。不同编码语言进行转换时会损失语义。统一的编码更有益于互操作。先简单回答一下。

- 评论人:数字学徒

Fri Jun 17 16:51:45 CST 2005  作者Blog

我想向K老师了解:《名人手稿馆元数据著录系统》采用XML SCHEMA作为元数据模式,是否的确体现出比以往的非XML模式有更多的优点?

- 评论人:Y

Fri Jun 17 09:48:47 CST 2005  作者Blog

上海图书馆可以说是国内较先进的几个进行元数据研究的图书馆之一(据我所知,另外还有国图和北大图书馆),看了上面的介绍,还有更详细的"名人手稿馆元数据方案的设计"(http://www.libnet.sh.cn/sztsg/fulltext/reports/2005/CelebrityManuscriptMetadata2.pdf),觉得此方案设计理念、框架和模型均考虑得较周到,与传统方案相比在可扩展性、互操作性、开放性方面较有优势。这可以说是在数字图书馆研究方面的有益探索吧。
名人手稿数字图书馆也可以看作是特色数据库的一种,因为大多常用的数据资源根本没有必要每个图书馆再进行各自的标引和著录,所以特色资源的收集整理将是图书馆的一项重要的工作,国内特色数据库建设的软件已有很多,如CALIS建设的全国高校专题特色数据库,截至2005年1月止,与CALIS管理中心正式签订“CALIS服务体系第三方软件供应承诺协议书”的软件商新增至八家:
1. 北大方正电子有限公司
2. 北京新星快威数码技术有限公司
3. 北京义华数图科技有限公司&中科软件集团公司
4. 杭州麦达电子有限公司
5. 北京中数创新技术有限公司(新增)
6. 清华同方光盘股份有限公司(TPI)(新增)
7. 北京国图数字技术有限公司(新增)
8. 北京拓尔思信息技术有限公司(TRS)(新增)
并且制定了《CALIS特色库子项目描述元数据规范及相关规则》。
不过,这些软件对数字资源的标引著录方法,我正在了解之中!

评论内容: