但形势似乎正在转变:阿鲁巴国家图书馆的在线
馆藏(由互联网档案馆托管)于 2019 年上线,如今已发展成为一项名为“阿鲁巴馆藏”(Coleccion Aruba )的真正意义上的国家级馆藏项目,拥有来自阿鲁巴及其他地区的十几家合作机构,提供七种语言的手写、印刷和视听作品,其中包括这是目前最大的帕皮阿门托语在线文本语料库,包含超过一百万个数字化和原生数字页面。借助这个不断增长的帕皮阿门托语文本语料库,像 ChatGTP 这样的大型语言人工智能模型 (LLM) 现在可以与帕皮阿门托语/u 进行对话和回答。帕皮阿门托语/u 也已被Meta 的人工智能辅助“不让任何语言掉队”计划和谷歌翻译支持。就在不久前的 2024 年 1 月,欧洲委员会正式承认帕皮阿门托语为欧洲少数民族语言。此前,该语言已分别于 2003 年、 2007 年在阿鲁巴、库拉索和博内尔被列为官方语言。
下载完整的《消失的文化》报告。
人工智能的出现对文献遗产领域产生了深远的影响,其中一项最新进展便是手写文本识别(HTR)。随着Transkribus等人工智能支持的新技术的出现,手写文本识别技术不仅惠及富裕国家的大型机构,也惠及像阿鲁巴国 最新的邮件数据库 家图书馆(Biblioteca Nacional Aruba)和阿鲁巴国家档案馆(Archivo Nacional Aruba)这样的小型岛屿机构。这两家机构早在2019年就采用了这项新技术。将文本层添加到扫描的手稿中,如同打开了蕴藏着数百年书面记录、信函和散文的文献宝库——所有这些都触手可及。
https://i.postimg.cc/j2Lq09JY/zui-xin-de-you-jian-shu-ju-ku.png
在2022-2023年由互联网档案馆、阿鲁巴国家图书馆和阿鲁巴国家档案馆合作开展的名为“阿鲁巴收藏”(Coleccion Aruba)的试点项目之后,互联网档案馆的阿鲁巴子馆藏成为首批提供手写文档全文检索功能的在线平台之一。该功能已完全集成到其全文检索功能中,用户可以轻松查找数百年前文献中的词句,就像查找当前新闻报道中的文字或短语一样便捷。鲜有(商业)档案平台单独提供手写资源的全文检索功能,更不用说像互联网档案馆这样完全集成且免费提供此功能了。
2024年4月,互联网档案馆及其阿鲁巴合作伙伴宣布计划将所有以帕皮阿门托语出版的作品数字化,进一步扩大帕皮阿门托语的在线影响力。该计划首先从阿鲁巴国家图书馆的国家馆藏和特藏开始。这些作品将由各机构自行数字化。为了协助这项工作,互联网档案馆承诺向阿鲁巴岛运送一台图书扫描仪,以提高岛上的扫描能力。在拜访了新的合作伙伴阿鲁巴收藏馆之后,互联网档案馆还与阿鲁巴国家广播公司Telearuba携手合作,共同对Telearuba的直播和电视节目进行数字化保存。一旦与上述未来对帕皮阿门托语的自动字幕支持相结合,阿鲁巴数千小时的视听遗产也将开放全文搜索,用于进一步研究和在阿鲁巴教育系统中使用。阿鲁巴的教育系统目前正在从完全用荷兰语授课的殖民时代教育系统过渡到以母语为基础的多语言模式教育系统。
頁:
[1]