民国经典期刊 当代重现辉煌

u=4136101927,1613853301&fm=21&gp=0

创刊于1904年的《东方杂志》是商务印书馆的标志性刊物,被学界誉为“民国第一期刊”和“中国近现代史的资料库”,也是研究民国史不可或缺的第一手资料。鉴于《东方杂志》所蕴含的巨大史料和学术价值,商务印书馆特将其列为数字出版的重点规划项目,并已建成全文检索数据库。可喜的是,数据库上市两年多以来,已获得经济效益和社会效益的双丰收。

《东方杂志》民国第一期刊

《东方杂志》是商务印书馆的标志性刊物,创刊于1904年(清光绪三十年)3月11日,至1948年12月终刊,刊龄长达45年,先后在上海、长沙、香港、重庆等地出版。历经清末、辛亥革命、五四运动、抗日战争、解放战争等各个重大历史时期,紧跟时代脉搏,忠实地记录了中国近现代发展的轨迹,是近现代期刊史上影响最大、刊龄最长的综合性杂志。

《东方杂志》最初为月刊,中途改为半月刊,后又恢复为月刊。创刊时为24开本,后改为16开本。共计44卷,819期/号,812册,含3种增刊,46种专号、纪念号,22种专辑、特辑,包括3万多篇文章、1.2万多幅图画、1.4万多则广告,共计1亿多文字。

《东方杂志》纸质原刊

《东方杂志》历任主编有蒋维乔、徐珂、孟森、杜亚泉(陈仲逸)、钱智修、胡愈之、李圣五、郑允恭、苏继庼等。中国近现代史上的所有大家几乎都是它的作者,包括梁启超、胡适、蔡元培、严复、鲁迅、陈独秀、王国维、冰心、马寅初、胡愈之、陈立夫、于右任、黄炎培、朱自清、梁实秋、刘海栗、恽代英等。很多名家创作的名篇都是在《东方杂志》上首次发表的,例如鲁迅的小说《祝福》,即于1924年3月25日首发在《东方杂志》第21卷第6期上。

《东方杂志》初期是一种文摘类性质的刊物,杂集各家报刊时事新闻、各类消息,力求全面、客观、准确地反映国内外政治、经济、文化、教育、军事等诸方面的最新信息;后经几次大的调整和改革,逐步成为以时事政治为主的社科类综合性刊物。先后辟有社说、时评、选论、谕旨、内务、外交、军事、教育、财政、实业、交通、商务、宗教、杂俎、记载、文件、调查、附录、译件、小说等栏目。例如,东方杂志社于1932年11月1日向全国各界知名人物遍发通启400余份,提出:先生梦想中的未来中国是怎样?到12月5日截止时,共收到答案160余封。1933年,《东方杂志》第30卷第1期以“新年的梦想”为题,发表了142人的答案。柳亚子、谢冰莹、郑振铎、郁达夫、叶圣陶、张申府、邹韬奋、楼适夷、杨杏佛、巴金、林语堂、茅盾、陈立夫等都撰写文章阐述了自己的“中国梦”。

简言之,《东方杂志》堪称“民国第一期刊”,是“中国近现代史的资料库”“杂志界的重镇”“杂志的杂志”,也是研究民国史不可或缺的第一手资料。

全文检索数据库

民国资源数字化开发的成功实践

鉴于《东方杂志》所蕴含的巨大史料和学术价值,商务印书馆将其列入数字出版的重点规划项目,旨在将商务印书馆在新中国成立前出版的以《东方杂志》为代表的、影响力巨大的民国期刊全部数字化,建立国内外首家可供专家学者以及广大用户进行全文检索的民国期刊数据库平台。

《东方杂志》全文检索数据库的开发自2011年初开始,于2013年下半年顺利通过专家验收,2014年3月正式上市销售,目前已取得极大的社会效益和经济效益。截至2016年3月,该数据库已行销海内外多个地区,初步形成品牌影响力和用户口碑。

《东方杂志》全文检索数据库包括互联网版和局域网版两种产品形态,是一个适用于多行业、多区域的以机构用户(图书馆、社科机构等)为主的研究型数据库。该数据库的最终用户多为(近现代)历史学、文学、社会学、新闻学、经济学、马列哲学学科以及相关交叉学科的研究人员。只要涉及民国时期的学术研究,《东方杂志》都是非常重要的参考资料。

该数据库是国内传统出版行业中第一个针对民国期刊资源进行大规模、商业化开发的数字出版产品,很多功能的设计理念及其实现都具有行业创新性,按照项目评审专家的评价——“该数据库是民国资源数字化开发的成功实践”。

数据库的功能

全文数据检索操作简易便利

《东方杂志》全文检索数据库实现了真正意义上的全文数据检索功能,拥有简单易用的操作界面,方便精准的图文对照功能,高效强大的检索功能,丰富多样的服务功能。该数据库着重优化页面结构,提高用户体验,实现平台的易用性和实用性;实现检索输入页面、检索结果页面的流畅操作,减少迷失度和页面噪声干扰;提供标准化的、具有风格一致性特点的检索模式,提供多种检索方式,帮助用户快速定位文献;原版阅读功能极大地满足了读者查询原文的需求,并且操作简单快捷。

该数据库的中间结果页面主要分为标题区、文章列表区、二次检索分组区以及学术趋势图等。检索结果按照标题、栏目、作者以及卷、期属性分类。学术趋势图是系统提供的附加功能,旨在对检索关键词进行词频统计,并以图表(包括折线图、柱图和饼图等)方式显示给用户。

该数据库的文章细览页面主要分为标题区、文章正文区、系统功能区、内容显示区和关联内容显示区域。其中,文章正文区对检索关键词和专名词汇进行高亮显示,并在页面中内置锚点服务的链接标识,提供文本内容与原始图片的精确定位功能。

民国期刊资源数字化开发难点

版式字体多样标点格式繁多

相对现当代期刊资源,民国期刊数字化工作有其自身难点。以《东方杂志》全文检索数据库为例,数字化开发的难点主要表现为以下几个方面:

原刊保存质量不高。《东方杂志》属于历史文献,由于年代久远,保存殊难,部分原刊的品相较差,难免会出现诸如字迹模糊、图像不清等问题,增大了数字加工的难度。

版式凌乱。《东方杂志》的版式极为复杂,铅印、繁体、竖排,字体、字号以及排版格式很不规范,因此导致识别软件的识别率不高,必须要进行大量的人工干预才能保证文本识别质量。

文章中标点格式繁多。《东方杂志》发行初期,中国正处于从文言文向白话文演进的阶段,因此早期《东方杂志》的文章中存在大量的“行外符号”,经统计至少有8种类别。这些“行外符号”的存在,无论对于前期的数据加工还是后期的内容呈现,都增加了较大的运作成本。

文章中存在大量异体字。《东方杂志》的内容都是繁体文章,异体字较多,由此衍生出大字符集的问题,增大了后期程序开发的难度。

广告类型多、内容杂。《东方杂志》中的广告是其重要的组成部分,主要分为10大类,其中图书类广告占半数左右。图书广告内容多、字小;其他广告内容少,但是多为手写体。因此绝大部分广告内容都不能通过软件识别,而要采用人工录入的方式。

总之,该数据库的开发工作经历了一个从摸索、总结到技术成熟的过程,并最终形成一套较为系统、完整的数据加工及功能设计的运作流程和规范。

开发效益社会效益及经济效益双丰收

《东方杂志》全文检索数据库上市2年多以来,已获得经济效益和社会效益的双丰收。

截至目前,该数据库已获得多项殊荣,其中包括“第五届中华优秀出版物奖电子出版物奖”、第七届中国出版集团出版奖“特殊贡献奖”及“优秀数字出版奖”等。

此外,该数据库已积累大量用户,其中包括中国人民大学、中共中央党校、中国社科院、中国国家博物馆、香港中文大学、(台湾地区)辅仁大学、美国莱斯大学、澳大利亚国立图书馆、德国柏林国立图书馆等著名海内外高校和社科研究机构。

该数据库面世之后广受赞誉,诸多用户纷纷来信,表达其对学术研究工作的帮助。例如,“我自己原本拥有整套《东方杂志》的扫描版,但检索非常困难,这套数据库检索方便,非常好用”,“贵单位的《东方杂志》数据库是我使用过的最好的数据库,准确而全面,甚至连广告、插画都没有遗漏,我曾试着校对几篇文篇,准确率极高”等。

该数据库还先后资助了“百年汉语发展演变数据平台建设与研究”“民国地理学与现代中华民族认同研究”及“中国传统行政道德思想与当代政府文化的培育研究”等共计六个国家及省级社科基金项目,有力地助推了相关学科的学术研究。

后续规划“十大民国期刊”全面数字化

商务印书馆拥有丰富的民国出版物资源,《东方杂志》全文检索数据库的成功运作,使商务印书馆更加坚定了对已有民国期刊进行数字化开发的决心。

商务印书馆计划将包含“十大民国期刊”在内的所有已出版的民国期刊进行全文检索数据库形式的开发,形成自有知识产权的知名数字产品。它的建成将使得商务印书馆成为国内一流的民国期刊资源数字化产业基地,国内民国出版物资源数字化产业的“国家队”。

责任编辑:陈丽壮
分享到微信

分享到:

联系我们技术支持友情链接站点地图免责条款
主办单位:乐鱼(中国)leyu·官方网站
网站开发维护:中版集团数字传媒有限公司
Copyright 乐鱼(中国)leyu·官方网站 2015,All Rights Reserved
京ICP备16000259号-1     京公网安备 11010102002206号