当我请西蒙描述他理想的针织机穿孔卡数字化和保存工作流程时,他的说法让我感到惊讶——根据项目目标,保存在杂志和书籍中的编码信息可能比穿孔卡本身更适合作为起点。扫描穿孔卡真的很难。他指出,实体穿孔卡会发生各种各 企业电子邮件列表 样的情况,使其更难数字化——它们会弯曲或撕裂(就他研究过的自动钢琴卷轴而言,人们会以各种方式修理和修改它们)——所有这些都是有关使用情况的有趣材料信息,但也对计算机视觉构成了挑战。
如何处理被胶带遮盖的孔
不仅是一个创造性的决定,也是一个技术问题:扫描能否捕捉到这些孔?我们是否应该在编码中引入一个新字符来表示胶带?他强调,杂志并 打孔卡保存过去和未来 非万无一失——数字化光面纸面临诸多挑战,尤其是在试图快速或自动化完成的情况下。
无论来源材料是什么,西蒙都强调高质 :“从后人的角度来看:扫描质量非常重要——尽可能地保存它:现在难以解析的东西将来只会变得更容易解析。”
西蒙都强调高质 打孔卡编码
目前,存储解析并传播该信息而无需重复手动或计算机视觉辅助编码过程依赖于社区支持的基础设施。
Brenda A. Bell 的生成器所接受的格式,可以根据用户的纯文本文件生成特定穿孔卡片样式的 SVG 文件,已经成为此类信息的实际编码 巴西商业名录 方式之一,即以 ASCII 编码的 .txt 文件——这是一种归档和共享穿孔卡片的方式,它突破了基于图像的归档的局限性,尽管需要更多的前期人力投入。请参见下图中的示例。
文本文件比图像小得多
可以轻松存储在个人硬盘和云存储中。许多社区运营的 Google Drive 可以作为这些穿孔卡的存储库。就存储和流通而言,Bell 生成器所接受的 ASCII 格式提供了很大的灵活性——即使当前格式将信息与其原始使用条件脱节,我们也可以使用轻量级开源软件快速地重新混合、编辑和修改穿孔卡图案。Simon 指出,标准化的元数据结构可以在这方面发挥很大作用——也许是一个标准化的纯文本标题——我想象着,如果能将穿孔卡编码语料库与其来源和数字化元数据以及存储在互联网档案馆等地方的源图像链接起来,我就能做些什么。我们将从中学到什么关于针织和纺织历史的知识?哪些创造性的重新组合是可能的?