革新的な技術によって、古代の言語を解読することは、もはや挫折と混乱に満ちた骨の折れる仕事ではなくなってきています。 高度なアルゴリズムに従った洗練された機械が、世界中の研究者を助け、しばしば古文書や失われた言語を理解するという途方もない仕事を担っています。
言語学の専門家によると、人類はその歴史の中で、大まかに見積もって3万1000の言語を話してきたと言われています。 現在では多くの言語が死語とされている。 新しい人工知能プロジェクトが、古代語で書かれた文章をいかにして解読するかという問題に対する答えの一部になるかもしれない。
こんなのって、どうしたらいいんだろう? 専門家の間では、言語は変化しても、多くの記号や言葉、その流通の仕方は時間が経っても比較的一定であると考えられています。 祖先の言葉とのつながりのおかげで、長い間失われていた言葉の解読に挑戦することができるのです。
そしてこの知識は、MITのコンピュータ科学・人工知能研究所の研究者とGoogle Brain人工知能プロジェクトの研究者の共同研究の基礎となっているのです。 プロジェクトチームは、”未知の言語の単語を、同じ語源を持つ他の言語の関連語や関連語と照合し始めることができるアルゴリズムを開発した。”という。 コンピュータと言語学の進歩を利用し、研究者が古文書を解読するためのアルゴリズムの作成が進んでいます。
暗号化されていない言語にはまだ適用されていませんが、研究者たちは、アルゴリズムのためのまともなデータセットを提供するのに十分な例文を持つテキストの翻訳において、人工知能が進歩していることを示しました。 これまで、システム線形B文字とウガリット語という、これまでほとんど別の方法で翻訳されてきた古代言語を教えることに重点が置かれてきました。 B線文字とは、今から3000年以上前の青銅器時代後期にミケーネ文明で使われていた文字です。 1953年、マイケル・ヴェントリスという建築家によって初めて解読された。 ウガリト語はヘブライ語の初期形態に非常に近く、約3000年前にも存在していた。 1929年にフランスの考古学者によって楔形文字で発見されたのが最初である。 人工知能システムをテストするために、研究者は「解読すべき文脈と文字の並びに関する4つの重要な特性、すなわち分布の類似性、単調な文字マッピング、構造の疎密、認知機能の著しい重複に着目した」のです。 ホット:オーストラリアの消防士が動物たちと一緒にチャリティーカレンダーに出演 その甲斐あって、プロジェクトの報告書には「このシステムをウガリット語の解読に適用したところ、現在の結果よりも5.5%の絶対的な翻訳向上を達成した」と書かれています。 また、古代ギリシャ語に関連する音節言語であるリニアBについて、人工知能モデルが67.3%のテキストを正しく翻訳した最初の自動翻訳結果も報告します」。 つまり、この新開発は、こうした古代言語の学習作業を加速させたい研究者にとって、有用なツールとなり得るということだ。 古代の文化を理解することは、間違いなく翻訳の仕事の一部です。この意味で、人工知能はまだ人間と同じように行動することはできませんが、非常に大きなアドバンテージを持っています。 専門家であれば、未知のアルファベットの文字を翻訳し、他の言語の文字とすばやく照らし合わせることができます。 ある古代言語の文字や記号を、他の古代言語や現代言語の文字や記号と比較するために、貴重な時間を無駄にする必要はないでしょう。機械が数分で、より正確な結果を出すことができるのですから。 2018年12月、トロント大学のアッシリオ学者であるエミリー・パジェット=ペロンが、紀元前21世紀のメソポタミア行政文書6万9000件を機械翻訳するプロジェクトをコーディネートしました。 オックスフォード大学でアッシリ学を教えるジェイコブ・ダール教授は、「ギリシャ、ローマ、古代エジプトよりもメソポタミアからの資料が多い」と指摘する。 しかし、何千枚もある楔形文字のうち、解読されたのはわずか10%。 問題は、扱うべきテキストが不足していることではなく、それを読む専門家が十分にいるかどうかだ。
メソポタミアの楔形文字タブレット
ウガリット語の文字が書かれた標識
ミケーネ文明に関連する錠剤
これを共有する。