2018年2月6日火曜日

謎のボイニッチ手稿にAI、解読方法が判明?

謎のボイニッチ手稿にAI、解読方法が判明?
8割がヘブライ語の単語と一致、カナダの科学者らが主張
*ギャラリー:ボイニッチ手稿(写真クリックでギャラリーページへ)
米イェール大学の貴重書室に保管された小さく素朴な本「ボイニッチ手稿」は、世界で最も謎の多い書物の1つだ。貴重な文書には優美な文字と不思議な絵が並び、600年ほど前に書かれたと考えられている。使われているのは未知の言語か、暗号化された言語とされ、いまだ解読されていない。

 長年にわたり暗号解読家たちを悩ませてきた「ボイニッチ手稿」。何語で書かれているかすら分からない約600年前の謎の本に、カナダの研究者2人がAI(人工知能)を使って挑戦し、解読方法を発見したと主張している。 その論文が掲載されたのは、学術誌「Transactions of the Association of Computational Linguistics」。だが、手稿の内容はまだ謎に包まれており、他の研究者たちは懐疑的だ。

ボイニッチ手稿とは?
 ボイニッチ手稿は、15世紀の中央ヨーロッパで書かれた本で、暗号化された文字列とされている。今のペーパーバックより少し大きく、材質はもろい上質皮紙(字を書くための動物の皮)だ。ページ数は246。折り込みの索引があったらしいが、ずっと以前に失われた。ページ番号が飛んでいる箇所があり、どこかの時点で綴じ直されたことを示す。したがって、現在のページ順は刊行時から変わっている可能性がある。

*丸の多い優美な文字で書かれていた。

 書体は丸を多用した優美かつ独特なもので、2530字が左から右へ書かれ、段落は短い。あちこちに詳細な絵が挿入され、城やドラゴンの絵もあれば、植物、惑星、裸の人物、天文学のシンボルの図解もある。いずれも、緑、茶色、黄色、青、赤のインクで彩色されている。特に好奇心をそそるのは、何人もの裸の女性が一連の緑色の液体に浸かっている挿画だ。

 手稿は、1969年から現在まで米イェール大学のバイネキ稀覯本・手稿図書館に収蔵されている。名称の由来は、ポーランド人の古書商ウィルフリッド・マイケル・ボイニッチだ。ボイニッチは1912年、イタリアでイエズス会の図書館からこの本を購入。その後、一般に呼びかけて翻訳できる人を探したが、残念ながら誰一人成功していない。

*緑色の液体に女性が浸かっている。

手稿の内容について、手掛かりはあるのか?
 イラストに基づき、手稿は草本、天文、生物学、宇宙、薬学、処方という6つのセクションに分かれると研究者たちは考えている。魔術、あるいは科学の本かもしれない。
 古い記録からは、手稿が錬金術師や皇帝たちの手を経てきたことが分かる。16世紀後半には、神聖ローマ皇帝が英国の占星術師から600ベネチア・ドゥカートで手稿を購入。皇帝はこれを、中世の托鉢修道会士で偉大な哲学者であるロジャー・ベーコンの作だと考えていた。後に、手稿はボヘミア人薬剤師の手に渡った。

最新の研究で何が分かったのか?
 論文の著者らはボイニッチ手稿について、「暗号解読の課題のうち最も困難な部類」だと述べている。使われている秘密の暗号どころか、どの言語で書かれているのかも分からないからだ。おそらく、後者の方が大きな問題だろう。

 2人の研究者は、独自に設計したコンピュータープログラムで手稿に挑んだ。彼らはもともと、手稿は母音を省略した1種の「アルファグラム」、つまり1単語中の文字をアルファベット順に並べ替えたアナグラムと推測していた(例えば、「manuscript」(手稿)はアルファグラムで「acimnprstu」となる)。そこでアルゴリズムを訓練し、言語を変えて書かれた国連の世界人権宣言380種類を解読できるようにした。

 このAIが、97%の成功率でアナグラムと現在の単語を一致させられた段階で、ボイニッチ手稿の最初の10ページに書かれた文字列を読ませた。
 アルゴリズムの判断は、暗号化された単語の8割以上がヘブライ語だったというものだった。

 これで、言語はおそらく分かった。次は、使われている暗号を読み解く必要がある。そこで、2人はヘブライ語が母語の同僚に冒頭の文を渡したが、意味の通る英語に訳すことはできなかった。他に意見を聞ける学者がいなかったため、2人はGoogle翻訳を使うことにした。多少のスペルミスを直した上で、最初の文はこう読めた。「家長と聖職者、私、そして人々に彼女は勧めた」。奇妙な文だが、確かに意味をなしている。
 加えて、「草本」の章と呼ばれる72語の部分を訳したところ、2人が推測した暗号から、「農家」「光」「空気」「火」という単語が解読できた。

えっ……Google翻訳?
 そう、Google翻訳だ。この機械翻訳システムは、人が翻訳した数億もの文書を分析することで機能している。そして統計学を使い、過去の翻訳に基づいた翻訳結果を吐き出すのだ。1語ずつというよりも語句のまとまりごとに訳してはいるが、人間の翻訳者に並ぶ有能さとはまだ言えない。

 では、話を手稿に戻そう。

ほかにも、この研究に問題点はあるのか?
 まず、今回のAIプログラムは、15世紀の言語ではなく、現代の言語を英語に翻訳するという訓練を受けた。ボイニッチ手稿はヘブライ語で書かれたのかもしれないが、だとしても中世のヘブライ語のはずで、Google翻訳が使っている現代のヘブライ語ではない。

 また、この人工アルゴリズムは文字列の80%をヘブライ語と一致させたが、あと20%は別の言語ということになる。論文によれば、手稿にはヘブライ語以外にマレー語、アラビア語、アムハラ語が使われている可能性があるという。いずれもヘブライ語とはかけ離れた言語だ。

 公平のために言えば、研究者たちはボイニッチ手稿の全てにわたって秘密を解き明かしたと主張してはいない。そうではなく、文字列の言語と暗号化の体系を特定したとしている。次のステップは、ヘブライ語とアルファグラムに精通した学者を探すことだ。2人は、この暗号解読法を他の古い手稿にも応用しようと意気込んでいる。
 しかし、過去の挑戦者たちはいずれも正解にたどり着けず、さまざまな説が出されては、すぐに学者たちに誤りを指摘されてきた。ナチスの暗号「エニグマ」を解読した、有名なアラン・チューリングでさえ、ボイニッチ手稿を読み解くことはできなかったのだ。
 この文字列が暗号化された言語なのか、人工言語なのかもまだ分からない。しかも、全く無意味である可能性も残っている。

手稿について、ほかの説はあるのか?
 カナダのチーム以外にも、手稿がヘブライ語である可能性を指摘する研究者はいる。ほかにも数十の言語の可能性が議論されてきた。そのなかには、ラテン語や、シナ・チベット語族から生じた言語も含まれる。

 この本は、ロジャー・ベーコンの初期の発見や発明を記しているのではという見方もある。一方、キリスト教の異端の教派による混合言語(ピジン)の祈祷書とも言われる。さらには、オカルト哲学者が金を稼ごうとして売った無意味な文の寄せ集めという説さえある。
 暗号学の歴史の中で、ボイニッチ手稿は指折りの未解決問題であり続けている。毎年、多くの解釈が発表されるが、決め手となる暗号体系はまだ見つかっていない。2018.02.06 ナショジオ


本ブログ: (2014.5.18 及び 2012.12.28) も是非 参照してください

0 件のコメント: