文件格式与保存介质频繁淘汰
2022-11-28 16:24:37来源:cnBeta
有没有尝试过阅读100年前家族中流传下来的实体书? 可能效果依然不错。有没有试过阅读你10年前花钱买的电子书?可能会有不同的体验。从大型出版商的租赁商业模式到物理设备的演变,再到格式的过时淘汰,数字书籍现在被证明是脆弱的,受到威胁的。
对于我们这些关注数字化和天生数字书籍的图书馆的人来说,我们知道它们需要不断的维护--重新处理、重新格式化、重新激发活力,否则它们将无法阅读或被阅读。这其实也是互联网档案馆(archive.org)的工作:出版商试图将新的思想引入公共领域,图书馆获取和保存这些内容,并让它们在未来的日子里保持活力。
而且,为了服务有阅读障碍的用户,我们必须跟上他们使用的不断改进的工具。
大型出版商都说电子书不会磨损,但这根本不是事实。随着新的光学字符识别技术的出现,随着新的文本理解技术开启新的分析,随着格式从djvu到daisy到epub1到epub2到epub3到pdf-a的变化,互联网档案馆对其已数字化的书籍进行处理和再处理,这需要大量的计算机算力和程序员年来完成这项工作。
此外,保存电子书的数字媒体也在变化,从数字线性磁带到PATA硬盘到SATA硬盘到SSD,如果我们不积极照顾我们的数字书籍,它们很快就会变得无法阅读。
然后是编目和元数据。如果我们不跟上数字学习者不断变化的期望,那么我们的书将无法被找到,这也是一个持续的、昂贵的问题。纸质书籍在我们的书架上已经持续保存了几百年,而且仍然可以阅读,如果没有积极的维护,我们的数字书籍能坚持十年就不错了。
如果我们想在未来获得我们的数字遗产,我们需要做出一些结构性的改变:改变机构和出版商的行为,以及支持性的资金、法律和执法。
第一步是要认识到保护和获取我们的数字遗产是一项重要的工作,而且值得去做。 然后,找到机构--教育、政府、非营利和慈善机构--使保存成为我们日常责任的一部分的方法。