據(jù) HuggingFace 頁面顯示,來自荷蘭馬斯特里赫特大學的一個研究團隊近日發(fā)布一款可用于大模型研究的伊特魯里亞語數(shù)據(jù)集。
品玩報道,伊特魯里亞語是一種被用于公元前7世紀至公元1世紀的語言,被用在意大利地區(qū)。目前沒有公開的伊特魯里亞語語料庫可用于自然語言處理。
因此,該研究團隊出了一個從伊特魯里亞語到英語的機器翻譯數(shù)據(jù)集,其中包含來自現(xiàn)有學術(shù)資源的 2891 個翻譯示例。其中一些例子是人工提取的,另一些則是自動獲取的。
據(jù)研究團隊表示,發(fā)布該數(shù)據(jù)集有助于未來對該語言、類似語言或其他資源稀缺語言的研究。
評論 {{userinfo.comments}}
{{child.content}}
{{question.question}}
提交