顾青:中华书局古籍数字化的理念与实践

  • 发布日期:2016-11-02 新闻来源:图书交易网

编者按:古籍数字化是中华古籍保护计划工作的重点。今年4月中华书局推出了“中华经典古籍库”微信版,共包含896部古籍、5亿字,准确性远远超越了其他商业性古籍数据库。中华书局总编辑顾青在中国图书馆年会上介绍了中华书局在古籍数字化方面的经验与理念,并展示出了他理想中的古籍数据库。

10月25日-27日,2016年中国图书馆年会在安徽铜陵召开。本次年会共设有图书馆服务创新趋势与能力建设、公共图书馆评估定级、国家公共文化服务体系示范区创建、大众创业万众创新背景下图书馆服务新模式4大主题论坛,以及涵盖阅读推广、标准化建设、总分馆制建设、古籍保护等图书馆创新发展等诸多内容在内的25个分会场。在“古籍数字化及其在图书馆应用研究”第4分会场上,中华书局总编辑、古联公司总经理顾青发表了名为“中华书局古籍数字化的理念与实践”的演讲。

顾青提到古籍数字化的三种类型:第一,基于数字图书馆的理念,以保护收藏、提供阅读服务为目的的“古籍保护的数字化”;第二,基于古籍整理的理念,以提供文本浏览和多功能检索为目的的“古籍整理的数字化”,也是中华书局自2003年起主要致力于探索的一种;第三,传统经典古籍的大众应用;满足公众对传统古籍和内容的多方面的需求的“古籍普及的数字化”。

据顾青介绍,在古籍数字化探索中,中华书局形成了一系列的理念:首先,古籍数字化必须以古籍整理为基础。目前的传世古籍存在大量问题,如果不整理,难以投入广泛使用。在整理古籍时,必须按照规范和标准来整理,这样才能保证质量,才能整理出被广泛引用的善本。但是当前的一些古籍数据库无法被直接征引,低于学术应有的水平,也不符合学者的期待。

其次,古籍数据必须优质合法。古籍的现代整理已有百年历史,创造了丰富的可供数字化的成果。初步统计,民国整理约1万余种,新中国整理出版古近3万种,其中可以数字化的比较好的版本约3000种,许多是富有盛誉的古籍整理精品。同时古籍整理作品还拥有著作权,被中国的著作权法和司法实践确认,既包括纸质著作权也包括信息网络传播权。

再次,古籍数字化的服务必须符合用户需求和学术规范。数据库的服务功能虽然是技术创新,而且也依靠技术创新来提升古籍整理的水平和使用效率,但也一定要符合古籍使用者的需要和学术规范。

最后,古籍数字化的技术标准必须符合中文古籍特点。古籍数字化流程中,数据采集标准规范、图像采集处理规范、文字采集规范、资源内容表示规范、古籍用字标准、专有名词标准、整理本古籍元数据标准、整理本古籍文献数据标注标准等等,都必须符合中文古籍的特点。

顾青进一步阐述了他的理想古籍数据库,必须包括以下四个特点:基于古籍整理成果和规范的海量合法数据;基于中文古籍语言特征和文献体系特点的统一标准;基于多用户需求的多功能的多媒体服务;基于产业化运作的可持续的运营模式。

顾青最后回顾了中华书局探索实践的历史并展望未来——中华书局和古联公司牵头承建的“国家古籍资源数据库”包括“中华经典古籍库”和“国家古籍整理出版资源平台”两个项目。前者是用于阅读、检索、写作参考的专业古籍数据库,目前为5亿字,年底达到7.5亿字,十三五期间计划达到30亿字。后者是古籍整理产品的生产、发布、交易公益平台,还在持续建设中。

责任编辑:陈丽壮
分享到微信

分享到:

联系我们技术支持友情链接站点地图免责条款
主办单位:乐鱼(中国)leyu·官方网站
网站开发维护:中版集团数字传媒有限公司
Copyright 乐鱼(中国)leyu·官方网站 2015,All Rights Reserved
京ICP备16000259号-1     京公网安备 11010102002206号