数位经录与时空资讯
2009年03月28日 17:08凤凰网华人佛教频道 】 【打印已有评论0

四、结语:台湾“大藏经全文数位资料库”目前成果及未来规划

以CBETA 2009年成果发表为例 

资讯时代的数位化作业,可将浩瀚的佛典陈现出有别于古文献不同的新的面貌与功能,如以前述多年来已建置的资料量及经验为基础,参照“数位经录”与“时空资讯”两项作业为方法,进而了解台湾已完成的“电子佛典”全文成果,相信通过各界的合作,新编撰的“大藏经全文数位资料库”将成为一项重要的学术资源。

因此不揣谫陋,提出“数位经录与时空资讯的交会”整合应用的功能,以探讨新时代“大藏经全文数位资料库”编撰的可行性。故本文文末即介绍CBETA拟于2009年4月15日发表的成果,以作为本文结语。

CBETA的作业重点不只在《大正藏》或《卍续藏》电子版,而是以完成汉传佛教电子佛典集成为首要目标。因此在整理完成《大正藏》、《卍续藏》两者不重复的典籍后,已开始就其他藏经所特有的典籍进行数位化工作。因此,先以“数字经录”完成的“佛教藏经目录数位资料库”(http://jinglu.cbeta.org/) 作为前行作业,从24种“现存藏经目录”筛选其他各部藏经可能的特有典籍,再经仔细核对,扣除有目无经、重复收录、内容分合等情况,目前确定收录的经目有389部。2007年9月,又进而开始与“台北版电子佛典集成”专案(http://taipei.ddbc.edu.tw/) 合作进行“集成”的工作,预计以三至四年时间完成目标。

这是一个全新的挑战,远比之前《大正藏》、《卍续藏》的数位化工程有着更高的难度,是以执行时也遇到一些困难,譬如这批待处理资料大都是年代久远的雕版藏经,常有字迹模糊的状况;而且,当中的字形异体变化极大,判别及规范均属不易。可以了解,从雕版藏经《高丽藏》到铅字排版《大正藏》,《高丽藏》经文用字的异体状况被大幅的规范(通用化);又,从铅字排版《大正藏》到 CBETA 电子佛典,其实也对《大正藏》异体用字做了相当程度的规范(通用化)。

2008年,《嘉兴藏》选辑是我们的工作重点。《大正藏》、《卍续藏》以外尚未收录的典籍大都集中在《嘉兴藏》,当中丰富的明清禅宗史料最为学界所企盼。进行中的《嘉兴藏》典籍共有283部1668卷,约1500万字,分“原选辑”及“新增选辑”两部份。目前已完成的《嘉兴藏》选辑电子档案,可以在国科会数典计画“台北版电子佛典集成”(http://taipei.ddbc.edu.tw/)网站阅读及取得。

CBETA不但着力于《嘉兴藏》,“补足现存历代藏经经文”的作业。同时,很荣幸,CBETA取得杜斗城先生所编辑《正史佛教资料汇编》(共一册)以及方广锠先生所编辑《藏外佛教文献》(共九册)的数位化授权,始能更进一步执行“当代补编及藏外文献”的作业,这两项珍贵的历史资料,于下一版光碟中会录入《正史佛教资料汇编》全文,以及《藏外佛教文献》部份册数。 

此外,对于已收录典籍的“新式标点”及“经文修订”作业的成果。新增的“新式标点”经文有95经282卷;而“经文修订”也新增了6657笔,分别为《大正藏》4877笔、《卍续藏》1780笔等。 

  已有0位凤凰网友参与评论   
 
匿名
用户名 密码 注册
     
作者: 杜正民   编辑: 栓子