一项由马丁·路德大学哈勒-维滕贝格(MLU)、约翰内斯·古腾堡大学迈因茨分校和迈因茨应用科学大学团队开发的新型人工智能软件如今能够解读难以辨认的楔形文字。与以往依赖照片的方法不同,该AI系统利用楔形文字片的3D模型,传递的结果比先前的方法更加可靠。这使得能够通过比较多个片上的内容进行搜索,为全新的研究问题铺平道路。
在这一新的研究方法中,研究人员使用了近2000块楔形文字片的3D模型,其中包括MLU收藏的约50块。据估计,全球仍然存在着大约一百万块这样的片,其中许多都有5000多年的历史,是人类最古老的文字记录之一。它们涵盖了广泛的主题,从购物清单到法院裁决,为人类几千年前的过去提供了一瞥。然而,由于这些楔形文字片是未经烧制的泥块,上面压入了文字,它们变得非常难以辨认,即使对于训练有素的眼睛也是如此。
为了解决这个问题,MLU的Hubert Mara助理教授提出了开发基于3D模型的人工智能系统的想法。新系统比以前的方法更好地解密了文字。原理上,这个AI系统的工作方式类似于光学字符识别(OCR)软件,它将文字和文本的图像转换为机器可读的文本。这有很多优势,一旦转换为计算机文本,文字就可以更容易地阅读或搜索。
MLU的Ernst Stötzner解释说:“OCR通常使用照片或扫描。对于纸上或羊皮纸上的墨水来说,这没有问题。然而,在楔形文字片的情况下,情况更加复杂,因为光线和观察角度会极大地影响某些字符的识别效果。”他开发了这个新的AI系统,作为他的硕士论文的一部分。团队使用三维扫描和其他数据对新的AI软件进行了训练,其中大部分数据由迈因茨应用科学大学提供,该大学负责3D模型的大规模项目。
该AI系统随后成功地识别了片上的符号。研究人员惊讶地发现,该系统甚至在实质上较差的图像材料(如照片)上也能够良好地运行。哈勒和迈因茨的研究人员的工作为迄今为止相对独家的材料提供了新的访问途径,并打开了许多新的研究方向。目前它只是一个能够可靠识别两种语言符号的原型,然而已知存在总共十二种楔形文字语言。未来,该软件还可能有助于解读受损的铭文,例如在墓地中的三维楔形文字。