大自然的大事:AI的另一个突破!数千年来旅行以?

人类历史始于写作。铭文是最早的写作形式之一,可以直接看出古代文明的思想,语言和历史。但是,现有的数字方法仅限于匹配文本级别,并且难以遵守对古代文献所需上下文的复杂推理和上下文理解。如今,Google DeepMind,诺丁汉大学及其合作在这一领域取得了重大突破。他们已经启动了一个名为AENEAS的多模式生成神经网络,该网络可以帮助预测公元前7到8世纪的拉丁文铭文。相关的研究论文,标题为“具有一般神经网络的古代文本”,并发表在《自然》中。研究小组说,大多数历史学家认为,埃涅阿斯可以与现有的研究过程无缝结合,并成为促进素的强大辅助工具g历史研究游行的变化。夏洛特·图普曼(Charlotte Tupman)从埃克塞特大学(University of Exeter)的评论中教授这种工具具有巨大的潜力,并且它们的应用不仅限于古代历史研究,而且还可能扩大了上次甚至其他语言的铭文。扩展全文
埃涅阿斯:让AI回到罗马帝国
铭文是探索古代世界的重要信息。每年新发现的大约1,500个拉丁文铭文,记录来自EM的剥夺的不同信息到奴隶的墓志铭,显示了文化和语言生活,涵盖了2,000和500万正方形的帝国正方形。
但是,解释这些重要的铭文并不容易,研究人员经常面临许多挑战。随着时间的流逝,铭文中的字母,单词甚至整个段落可能会丢失,并且这些缺失部分的长度和内容通常很难预测,从而使其更加复杂和困难o还原。
诸如恢复文本,地理识别和主观判断之类的任务都依赖于专家和学者来理解更广泛的语言和历史上下文的铭文。这个过程既耗时又需要高度专业的知识,学者们必须比较目标铭文在并行铭文中的潜力。研究人员通常专注于特定地区和年龄,但这也限制了他们大规模识别铭文和历史联系的能力。
为了解决这个问题,研究团队建议AENEAS-一种多模型模型,一种AI工具,在检查和预测铭文时,不仅评估了铭文对象的视觉特征,还评估了文本本身。
图|文本的翻译由埃涅阿斯的体系结构处理。
埃涅阿斯(Aeneasd背景铭文以支持研究工作。为了获得有关材料sizeal的更广泛的信息,埃涅阿斯将转录的图像和文本结合到一个共同的输入中,这是第一个可以产生任何长度文本修复的古老结果的模型。
埃涅阿斯输入是其文本的铭文和转录的图像。它的出色体系结构在角色的基础上完全运行,避免了以前方法中实现的单词级表示。至于铭文上下文化的过程,埃涅阿斯将列出与语料库(LED)培训文本最相关的类似铭文示例。此过程取决于历史悠久的数据以获取文本中的历史和语言模式,从而使模型可以基于语义和上下文进行比较。
埃涅阿斯在不同方面超出了先前的工作,该工具是Nprovides的调整建议,用于缺少长度的文本,而不是指定的长度。这种能力对于研究严重损坏的铭文尤为重要。
照片|缺少拉丁文字的预测。埃涅阿斯可以预测损坏的铭文中丢失的文本(红色文本)。该工具可以在不知道缺失部分的长度的情况下做出预测,就像该图中这种军事工具一样。
研究团队构建了各种拉丁铭文数据集,以训练包括EDR,EDH和EDCS_ETL在内的AENEAS模型。他们开发了一个复杂的处理流以标准化元数据,该元数据使用了独特的Tristegistos的独特身份,消除歧义和文本处理,使其成为可以处理的格式。并从数据集中获取铭文图像。
埃涅阿斯在实际研究中的表现如何?
为了测试埃涅阿斯在实践史研究中的有效性,该小组组织了一个大规模的人机合作实验“古代历史学家和人工智学”。该研究邀请了23名参与者铭文方面的专业知识,涵盖了从硕士学生到教授的水平,他们在一段时间内参加了与埃涅阿斯(Aeneas)联系的实验,该实验发展了研究现实的过程。
历史学家认为,埃涅阿斯所获得的平行文本是重要的研究点,使他们对关键活动的信任提高了44%。在人机合作下,文本调整和地理识别活动的表现要比人们或人工智能所产生的结果更好。在基因组工作中,埃涅阿斯(Aeneas)从实际年龄的平均范围内实现了13年的准确性。
与以前的AI模型相比,它们比较了AENEAS,这比ITHACA与所有评论的所有测量方法中都多,并且可以处理ITHACA无法应对的“未知长度”。在地理工作中,埃涅阿斯完全使用了多模式体系结构的好处,这进一步指示了仅使用文本的模型。在续集的识别任务中,埃涅阿斯在试验铭文的预测中表现出令人惊奇的准确性:误差的含义仅为13年,中误差为0年,这与历史学家提供的真正范围一致。
ENEA将向我们展示在历史研究的历史上改变人工智能的潜力,以及未来值得进一步探索的许多方向。
主要方向之一是将埃涅阿斯的功能集成到大型对话模型中。这将使更自然和互动的研究过程使历史学家询问系统,深入探索模型的答案,并得到更清晰的解释。
如何处理历史数据中固有的不确定性,尤其是在副词-IN -Future识别方面,仍然是一个重要的挑战。未来的研究可以专注于开发更好的技术来代表和评估广泛的系列范围,而不仅是为了改善模型的架构,但也更准确地反映了历史技能的细微差别 - 遵循Bymore精致的考试指标,而不是仅依靠与估计的时间范围的距离。
另一个有希望的方向是进行更多的消融实验,以确定不同模块的特定贡献(例如,视觉输入对不同任务的影响);并探索平行性在不同文本输入的上下文中的变化,以及系统对输入格式(以及不同类型的铭文)的敏感性。
进一步提高模型的多模式功能需要依赖更大的尺寸,高标准和公平原则。
同时,将研究范围扩展到拉丁文铭文之外也是值得探索的研究方向。这将有助于利用视觉模态超出MGEOGraphy特征的潜力,并可能有助于通过肖像画或其他考古学来进行副词序列Al提示。
最后,他们认为加深跨学科合作很重要,并希望未来的研究项目能够继续前进并进一步联系人文和自然科学。
AI扩大了对人的认可
AENEA代表着古老的文本研究的重大飞跃,具有以前的SOTA模型超出了具有多模式功能的建筑,可以恢复基于文本的长度的基于文本的文本,并且可以适应任何古老的写作语言和媒介(例如Papyrus,Manuscript或Coins)。
这些功能具有其潜力,可以在文本和上下文中的字母中扩展数据集,为缺失值提供假设,并作为增强基于对话的语言模型的模块化成分。
相关案例研究表明,埃涅阿斯作为铭文研究的AI可靠性。埃涅阿斯可以在平行情况下使用相关的铭文来产生准确的预测并显示数量的学术假设。如果埃涅阿斯应用于帝国纪念碑或省牺牲的铭文,可以模仿铭文,增加传统历史方法并产生准确而有意义的观点的过程。
研究小组认识到埃涅阿斯有一些局限性,并且与相应图像相匹配的铭文百分比相对较小,只有5%。尽管这一比例很小,但并不会破坏研究的实践视觉方面,而是暗示研究可能是对铭文图像的未来研究的重要起点。
对于古老的历史学家来说,埃涅西托(Aeneasito)是一个突破性的工具。它可以帮助研究人员确定不容易注意到或花费大量时间发现的数据连接。将来,对于阳光明媚的拉丁铭文研究人员来说,在工作中测试埃涅阿斯并讨论如何使用AI研究古代材料将是一件重要的事情。
这种工具的应用不仅仅是研究G古老的历史。其在后来的历史铭文甚至其他语言中应用的潜力也是压倒性的,并且有望在许多领域解决类似的问题。尽管THEAI工具仍然可能引起某些学者的争议,但需要传统的学术研究和AI方法来研究过去社会留下的大量铭文。
许多历史学家还教导,AI的使用激励研究人员审查其工作方式以及获得和传播知识的道路。测试工具(例如埃涅阿斯)以及反思科学研究问题引起的问题,也将有助于对未来古代社会的原始材料有深刻的了解。
五月 - set:xiaoyang返回苏胡(Sohu)查看更多