人工知能による意味の獲得に向けて ―序―

文責:加藤雄貴

○ごあいさつ

 初めまして。このブログタイトルでは、人工知能に意味を獲得させるにはどうすればよいのか、そのアプローチについて扱っていきたいと思います。そして、ゆくゆくは意味を獲得した人工知能による、人間並みの精度を持つ汎用機械翻訳の実現を目指したいと考えています。

 読者の方は、機械翻訳にどのようなイメージがあるでしょうか? ほとんどの方は、一度はグーグル翻訳のような機械翻訳サービスを使ったことがあるのではないかと思います。私も今まで何度もお世話になっているサービスです。文字を入力するだけでなく、文字の書かれた画像をなぞるだけで翻訳してくれたりと、利便性もどんどん向上しています。

 しかし、残念ながらこれらの機械翻訳サービスによって提供される翻訳文は、私たち人間が翻訳する場合と比べればクオリティが下がってしまうのも事実です。特に、長文や固有名詞などが含まれる文章を正確に訳すのは困難で、専門用語の溢れる海外の論文やらゲームのパッチノートの和訳を期待するのは難しいのが現状です。ディープラーニングの技術を用いたニューラル翻訳などの導入によって精度は向上しているものの、「ほんやくコンニャク」のある世界はまだ先なようです。

 そんな「ほんやくコンニャク」のある世界を目指し、そのための第一歩として人工知能に意味を獲得させるためのアプローチを試みることのできる場所を探し、このソサエティにたどり着きました。まずは、現状の機械翻訳サービスがどのようなものかを見ていきたいと思います。

○現在の機械翻訳サービスの限界と意味の存在

 現在の機械翻訳技術については、こちらの資料に分かりやすく記載されています。(⇒https://rp.kddi-research.jp/article/RA2017004

グーグル翻訳では圧倒的なビッグデータと桁外れの計算資源を用いることで言葉の持つパターンを学習し、パターンを媒介とすることで同じパターンを持つ各言語の言葉を対応させ翻訳を行っているのです。今までは「ありがとう」と「Thank you」を符合させるような辞書的なアプローチを行っていたものの、これらの言葉が持つパターンを媒介とすることで言語間を結び付けることに成功しました。この技術は「ニューラル翻訳」と呼ばれ、人間の程度には及ばないとはいえ機械翻訳の大幅な性能の向上をもたらしました。 

 この資料の重要な指摘は、資料の最終章の『言葉の意味を理解することなく、言葉を自在に操る一種のイディオサバン』という言及です。機械翻訳では、実のところ言葉の意味というものが取り扱われていないのです。意味を理解していないのにどうして翻訳ができるのか、という疑問があるかと思いますが、このニューラル翻訳ではたくさんの文章を機械に学習させることで、文章のパターンを学習させているのです。

ある単語が文章のどのような位置に存在しどのような言葉と共に扱われているのかといった情報を統計的に求め、そのパターンを意味とみなすことで、同じパターンを持つ言語間の単語を翻訳しています。言葉が指し示す意味内容(「海」という単後が私たちにイメージさせるような情報)を取り扱っているわけではありません。

こういった意味内容そのものを扱おうという試みは、人工知能研究の分野において初期から挑戦が続けられている分野ではあるものの、いまだに挑戦を跳ね除け続けている分野でもあります。ブルーオーシャンではありますが、その海域の名前は「バミューダトライアングル」なのです。

○このプロジェクトの目指す先

 このプロジェクトの目指す先は、人工知能による人間レベルの精度を備えた翻訳装置です。しかしこの目的地を目指すにあたっては、上述の人工知能による意味理解という問題が立ちはだかります。このブログでは意味理解という問題をクリアするためにどのようなアプローチが必要なのかを扱っていきます。

 分野としてのスタートラインは機械学習ではあるものの、意味の獲得は現在の特化型人工知能には不可能なタスクでもあり、そのクリアのために脳科学の知見を参考としています。特化型人工知能と脳機能の比較から意味の獲得には特化型人工知能を支える技術とは異なるアプローチが必要だと考えており、本編では強化学習に代わるアルゴリズムを見出すため、脳機能の中でも大脳辺縁系の機能に絞り、快と不快を扱う恒常系や時系列情報としての記憶を扱う海馬などを中心に取り上げ、その実装のためにそれらがどのように動作しているかを検討していきたいと思います。そして、ゆくゆくはそれらの動作に関する仮説を試すことができれば嬉しいです。