图 4:亚伯拉罕双关语的注释——一个词形,两种读法© ACDH。
图 4:亚伯拉罕双关语的注释——一个词形式,两种读法© ACDH。
然而,在纠正自动注释时必须做出的决定不仅需要时间;相反,对这些历史语言数据进行语言分析本身就是一项复杂且要求极高的研究任务,需要“深厚的历史文化知识、扎实的语言历史知识、对文本和文本传统的熟悉,以及高度的评估敏感性”,[17]正如 Wulf Oesterreicher 所证实的那样。在ABaC:us项目中,除了作者之外,Barbara Krautgartner和Eva Wohlfarter也被委以重任,从而保证了注释数据的一致性。对众多棘手的案例进行了详细讨论,如果有几种可能的解决方案,则一起讨论并做出决定。
上面的屏幕截图(图 4)显示,在网络应用程序中,只要光标靠近每个文档,就会显示词形和词性信息:从用户的角度来看,这种显示(例如,对于今天不再使用的拼写变体)有助于提高对文本的理解,也可以用来搜索这些词形和词性。同时,这种展示也可作为文献,使语言注释本身成为一项科学成就,并让其他用户能够理解。在这 18 万个代币中,肯定存在个别案例,可能会做出不同的判断。尽管应用了标准化的词分类系统,但在实践中仍然存在一定的决策空间。因此,未来的用户必须意识到注释始终是一种解释形式。
3.2.资源的多功能性
对亚伯拉罕·阿·圣克拉拉 (Abraham a Sancta Clara) 文本以及归于他的文本的语言注释 阿根廷电报数据 也表明了未来类似项目所需要的东西:允许以用户友好和高效的方式编辑自动生成的标签的工具。带注释的文本无疑是非标准的一个极端例子,但需要解决的问题并不像预期的那样具有时期特异性(因为在其他有效性领域也经常遇到非标准变体)。更令人欣慰的是,在ABaC:us注释经验的背景下,奥地利数字人文中心正在努力开发一个用户友好的webTokenEditor,以便在浏览器中快速、轻松地更正表格形式的数据。