Last Updated on 2022年3月26日 by 大山賢太郎
ドラえもんの心のつくり方: 超AIをついに開発!日本発の「ドラえもん的発想」が世界を変えるブレークスルーを起こす – 読書レビュー
目次
ドラえもんの心のつくり方: 読書レビュー概要
ここ数年来、私たちの生活はリモートやオンラインで激変しつつあります。特に、AIやロボと呼ばれる最新技術が毎日の職場や生活に入り込んできて、ますます頭の中は混乱しています。
そんな中、ついにGAFAMを凌駕するAI技術が日本から生まれるかもしれないという話題が飛び込んできました。なんと、ドラえもんの心を持ったAIが「のび太な」私たちを助けてくれる日が来るときがもうすぐ来るかもしれません。ドラえもんのように、私たちと普通に会話できるAIの誕生間近となってきたのです。
この本のメッセージ:
ついに日本からドラえもんの心を持ったAIが登場し、毎日の困った問題を解決する手伝いをしてくれる日が来るかもしれません。
近年のディープラーニングによるAIのブレークスルーは、人工知能の分野にめざましい発展をもたらしています。しかし著者は、ビックデータをいくら解析してもAIが人と自然な会話ができる日は訪れないと断言しています。
なぜならば、現在のAIには決定的な限界があるからです。このたった一つのことに気がつき、全く違ったアプローチを取れば、現在のAIにブレークスルーを起こし、われわれの仕事や生活をまったく変えてしまうのだと。
一体その秘密とは何でしょう。筆者は囲碁や将棋、画像認識や文章問題では人間を超える能力を発揮するAIが、なぜ、日常会話(自然な会話)できないのかその理由から解き明かします。
それは、AIにはドラえもんのような「心」が無いからだというのです。
本書の筆者である田方篤志氏は、心をAIに持たせることができれば、のび太とドラえもんのように自由に会話をはじめることができると言います。そして、「人の心を持ったAI」が日本発となって幸せをもたらすブレークスルーを起こし、世界を大きく変えていくことになると・・・。
筆者について
普通に会話ができる ドラえもんの心のつくり方1: コンピュータに意識が発生するまで
著者の田方篤志さんは、特許事務所に勤めるサラリーマンから32才で独立し、個人ビジネスをはじめます。そこで大成功して43才でアーリーリタイアします。そして若かりしころの夢を実現するため、ビジネスで生まれた収益を研究開発に回し、20年以上、続けてきました。
ロボマインド・プロジェクトを始めたのは、言葉の意味理解の画期的なアイデアを思いついたからです。誰もやったことのない研究には、日本では、誰もお金を出してくれません。手軽に成果が出ることだけをしてたら、根本的に新しいものなど、作り出せなない。
まだ誰も気がついていない、画期的なプロジェクトから世界を変える会話ができるAIを開発するべく、現在、YouTubeや電子書籍などで発信しながら、AIに自然な会話を可能にするマインド・エンジンを意欲的に開発中です。
ドラえもんのこころの作り方: 誰がこの本を読むべきか
この本を読む関心度の高いのは、次のような人たちです。
- 自分自身、ビジネス、私たちの日本経済にブレークスルーを起こそうという野心的な意欲を持った知的生産者の全ての人たち。
- ここしばらくのAI万能主義に対して懐疑的に感じていて、人間の可能性を拡張するためにAIはひれ伏すべきだと感じている人。
- 日本の失われた30年という表現に怒りを感じていて、日本の優秀さがこれから再び実証されると信じている人。
これに加えて・・・
- AIや最新技術に全く新しい予想外のブレークスルーが起こる(あるいは起こらない)経緯を見届けようという、感度の高い知的探求者を自認するすべての人。
なぜ、この本を読むべきか、そのメリット、その理由は?
現在、AIはDXの流れとともに急速に普及が進んでいます。しかし、職場や生活がますますデジタル化され、何か大切なものが失われていくように感じるのも確かです。
本書を読むことにより、AIの本質を知りその限界を理解できます。 さらには、それを突破するブレイクスルーとなる技術がどのようなものかをよりよく知ることができます。
特に、AIが人と同じ心を持った時に可能となる、自然な会話がもたらすメリットとはどのようなものか、その可能性について理解することができます。
本書の重要な構成
ドラえもんの心のつくり方: なぜ、ロボットと人は会話ができないのか?
つい最近まで職場やショピングセンターなど目につくところにいたソフトバンクのペッパー君、最近は見かけなくなったと思いませんか?
実は、ソフトバンクはこの ロボットの生産を既に終了しており、人員も削減したり配置転換したりしているようです。このAIによるロボットは、発売当初は大変に話題になり、多くの企業が職場や接客の場に置くようになりました。
しかし私も感じているのですが、 この一見愛嬌がありそうなロボットは、実は、大変失礼で、少し会話をすれば、すぐにこちらのことを理解していない、会話が続かないと感じる代物でした。
全く役に立たない、無用の長物となって、結局のところその多くは廃棄処分となったようです。これに対して、長い年月を経ても愛されるロボットも確かに存在します。
ペッパー君に先立つこと20年、ソニーはAIBOと呼ばれる犬型のペットロボットを1999年に発売していました。こちらは、もちろん人間のように会話をすることはできませんが、ペッパー君とは対照的に人の感情をくすぐる愛くるしいロボットでした。
現在、第二世代となっていますが、生産終了となった第一世代は長く修理して愛用され、ついに修理のための部品が手に入らなくなった時には、所有者が合同葬儀まで行ったということです。
この2つを比較すると、一体何が違うのでしょうか。ひとつは、人から愛されるロボットとなり、もう一つは 人から敬遠されるロボットとなってしまいました。
この2つのロボットに共通しているのは、どちらも人の動きや言葉に対して反応することです。しかしAIBOが人の感情や心を癒すようにできているのに対して、ペッパーくんは全くの逆でした。
私もペッパー君との会話を数度は試したことがあります。しかし会話を始めようとするのですが、解答がチグハグで意思の疎通がうまくいかず、相手を困らせたり怒らせたりしてしまいます。結局、怒りを感じて二度と近づこうとは思いませんでした。
AIの限界: AIは人と自然な会話ができない
新井紀子著『AI vs. 教科書が読めない子供たち』という本を読んだことはありますでしょうか?人工知能が東大の入学試験に挑戦して受かるかどうかということで、大きな話題となりました。これは国の研究予算が与えられたプロジェクトです。当初の結論は、私立大学レベルは受かるが東大は無理というものでした。
しかし本当の目的はAIの能力を調べることで、「AIでなにができないかを調べること」だったそうです。そして究極的に導き出された結論は「今のAIは言葉の意味を理解できない」というものでした。
新井氏によれば、「コンピュータが扱えるのは、論理、確率、統計の3つだけだ」と断言しています。 「コンピューターに絶対できないこと、それは言葉の意味を理解することだ」というのです。
しかし、その後の2019年にグーグルのBARTというAIプロジェクトが文章の読解力テストで人間を打ち破ったというニュースが世界中を駆け巡りました。 また2020年には、イーロン・マスク氏も関係するOpenAIが開発したGPT-3というシステムでは、AIが作った文章は人間が作った文章と見分けがつかないまでになったと言われています。
これらは自然言語処理と呼ばれますが、 ディープラーニング(深層学習)を使って膨大な言葉のデータを統計的に計算して文章を作るものです。 これには人間の意思を反映したものではなく、実のところは言葉の意味を理解しているわけではありません。日常会話(自然な会話)はできないのです。
これが現在のAIの限界であり、コンピュータが人と自然な会話ができない理由でもあります。なるほど、ペッパー君に違和感を感じたのはこういった理由だったわけです。
ここにブレイクスルーを起こそうというのが、田方氏の「ロボマインド・プロジェクト」です。
ロボマインド・プロジェクトとは
田方氏がロボマインド・プロジェクトで目指しているのは、のび太とドラえもんがするような会話です。
もしこれができれば、AIが人間が考えていることをよりよく理解できるようになり、自然な会話を通して意思疎通をしてコミュニケーションの密度が格段に高くなります。
コンピュータが人間の言葉の意味を理解するようになるということは、人の感情(気持ち)を理解できるようになるということです。
これにより、 コンピューターと人間のインターフェース(UI)に飛躍的な進化が起こります。人とAIが自然な会話を通して、より基本的なことで意思疎通できるようになることで、コンピュータと人間との関係が全く違ったものになってくるのです。
AIがよりみじかで、日々の生活に役に立つ存在。まさしく、ドラえもんの世界がはじまるのです。
なぜ、日本からブレークスルーとなるようなAIが生まれてこないのか?
人工知能に関しては、日本も世界の最先端を走ってきたことに間違いはありません。
現在は第三次AIブームと呼ばれますが、1980年代の第二次ブームでは、まさにバブル期の真っ最中に、日本は世界中が注目するプロジェクトで全く同じようなAIを開発しようとしていました。しかしほとんど結果を残すことなく、プロジェクトは失敗に終わりました。
現在、第三次AIブームは欧米の後追いの形で進んでいます。このきっかけとなったのは、2012年トロント大学の研究チームが画像認識のコンテストでブレークスルーを起こしたことです。これが現在のAIブームを牽引しているディープラーニング(深層学習)です。
これに関連し、田方さんは日本の学術研究者が抱える深い問題を痛烈批判しています。先ほどのプロジェクトでも、国の予算を使って「AIで何ができないかを解明する」とし、結果として「今のAIは、言葉の意味が理解できない」ということが、改めて確認できたというのです。
国の予算をとるわけですから、何らかの研究成果を出さないといけません。 これでは 研究者は無難な研究をすることになり、どうしても外国で大きな成果が出た研究を少し変えただけの研究となってしまいます。
つまり、今まで誰も成功したことがない研究を同じやり方でやって、「AIには限界がありました」と結果報告すればよいのです。これで予算を獲得できます。
これが日本からイノベーションが生まれない闇の構造だというのです。手軽に成果が出ることだけをしてたら、根本的に新しいものなど、作り出せません。
田方さんがロボマインド・プロジェクトを始めたのは、言葉の意味理解の画期的なアイデアを思いついたからだと言います。このような誰もやったことのない研究には、日本では、誰もお金を出してくれません。
田方さんは、ご自身のビジネスで生まれた収益を研究開発に回すことで、プロジェクトを20年以上、続けてきました。これは本当にすごいことで、頭が下がる思いです。
ロボマインド・プロジェクトが目指すところ
コンピュータと自然な会話をするには意味理解が必要ですが、今のAIには言葉の意味を理解することがまだできていません。
例えば、「うれしい(歓喜)」とか「ありがどう(感謝)」といったことをコンピュータは理解することができないのです。こういった、人であればわずか3歳児でもできる、自分の意志や感情を言葉を通して表現して伝えることができません。
これほど基本的なことがなぜ見逃されてきたのか、田方さんはそこから切り込んでいきます。鍵となるのは「意味理解」「会話」そして「意識」です。これを定義してコンピュータのアルゴリズムとして実現できれば、次のようなブレークスルーを可能にすることができると言います。
ロボマインド・プロジェクトが目指す2つのブレークスルー
田方私が主催するロボマインドプロジェクトが目指すのは、次の2つのブレイクスルーです。
- 自然な会話
- 人工意識
このどちらも、ここ最近急速に進歩しているAIでもできないことです。 もしこれらが可能になれば、非常に大きなブレイクスルーが起こることに疑いの余地はありません。しかし、これは本当に可能なのでしょうか?
1つずつ見ていきましょう。
1. 自然な会話をコンピュータで実現する
なぜ、AIは意味を理解できないのか
本書の特筆すべき点は、現在のAIの限界を明確にしていることです。現在のAIに何ができ、何ができないのか。そして、一体何をすればそこに未来の「ドラえもん」を開発し、私たちの相棒として迎えることができるのかを 語っている点です。
田方氏は、現在のAIの自然言語処理は、大量の文章から単語の数を数えて、どの単語の近くにどの単語が出現するか、と言う確率を延々と計算しているだけだと言います。AIが本当に言葉の意味を理解しているわけではないのです。
単語をビッグデータとして解析しても会話ができない。この根本的な間違いをおかしていることに、多くの研究者たちは気がついていません。
人間は複雑なルールを自然と処理しながら会話をしています。田方氏は、AIが人間と自然な会話ができないのは、「会話のルールと目的を理解していない」からだと言います。
ここが非常に重要なポイントです。田方氏はディープラーニングの本質を見抜くことが重要だといいます。ディープラーニングで1番重要なのは「特徴パターン」です。人間とディープラーニングが共通に持っているもの。それは、部分を組み立てて全体ができる、と言う世界です。
しかし、ディープラーニングは森の木を見ています。この一方で人間の認知は森全体を見ているのです。人間の認識する膨大な処理の中のほんの一部が、ディープラーニングがやっていることと一致した。巨大な森の中の一本の木、それがディープラーニングだと言うのです。
画像認識で人間の能力をこえる結果が得られたことにより、これまでにビックデータ神話が確立されました。ビックデータとAIさえあれば、全てを解決できると言う考え方です。
例えば、画像処理や文章の解析では、機械学習により人間よりもAIの方が高い認識率を達成しました。これは、ルールを教えなくても、AIが勝手にルールを学習したからです。しかし、これが成り立つのは、超単純なルールだからです。多くの研究者が、ここに間違いをおかしてしまいました。
なぜ、大量のデータがあっても会話ができないのか?
では、なぜ人間の能力を超えると言われる今のAIは、簡単な会話をすることができないのでしょう。
田方氏は、それは、大量のデータから1つの答えを導き出すのが今のAIだからだといいます。今のAIが苦手なのは、正解がないタイプの問題です。その典型が会話なのです。
いくら機械学習をしても、その答えが決まらないのです。 つまり、会話は機械学習できないのです。
AIが会話をするために必要なこと
さきほどの議論で、今のAIに会話ができないのは、それが正解ではないタイプの問題だからと言いました。しかし、入力に対して答えが決まらない場合でも機械学習できるものがあります。それはゲームです。
例えば、将棋ではある局面に対して、次の一手には様々な正解があります。しかし将棋や囲碁の世界では、すでにAIが人間を打ち負かしています。これはどうしてでしょう。
なぜ、ゲームではAIは人間を打ち負かすことができるのに、会話は3歳の子供にも勝てないのでしょう。
会話と将棋で比較します。この2つでは共通点と違う点があります。共通点は、正解が複数ある点です。違う点は、将棋には目的とルールが明確に決まっているということです。
将棋の目的は、もちろん敵の王将を取ることです。では会話の目的とは一体何でしょう?
会話にも目的のあるものと目的のないものがあります。目的のある会話は、質問タイプです。質問タイプの会話にはすでに今のAIで実現されています。医療業務などでも使われるエキスパート・システムがこの一例です。
問題は、目的がないタイプの会話、日常会話、雑談などです。 今の自然言語処理は、ルールも目的も考えないで次に出てくる言葉の確率を計算しています。これに対して人間は、複雑なルールを自然と処理しながら会話をしています。
これまでの自然言語処理は、その50年の歴史で大きな勘違いをしていると田方氏はいいます。そこには根本的な勘違いがあります。それは、言葉の意味を言葉で定義しようとしている点です。
例えば「意味ネットワーク」と言うプロジェクトでは、 これまでにコンピュータに100万語の言葉の定義を教えてきました。これでも足りないということで、次は1億語を教えようとしています。
これは、常識をコンピューターに教えようとしているのと同じです。しかし、言葉を言葉で定義して教えた結果として、どれほど膨大な知識があろうとも、 知識をどのように使うのかがわからなければ、何の意味もないのです。
会話で必要なのは、知識や常識ではなくて目的です。自然言語処理が最も力を入れて解決すべきなのは、会話の目的なのです。
コンピュータが言葉を理解するとはどういうことか
今のAIに絶対にできないこと。それは、自然な会話。その違いは、ルールと目的が明確かどうかです。
コンピュータで文を意味理解する事は、まだ、誰にもできていません。意味理解の定義は、これまでに誰もやっていないのです。これを、田方氏はロボマインドプロジェクトで解き明かそうとしています。
田方氏は、人間は、意味を理解したりコミニュケーションに必要なものを、既に持っているといいます。それは何かと言うと、「心」です。コンピュータに言葉の意味を理解させるには、「人間と同じ心」を作ればいいのです。
具体的な事例で考えてみましょう。人が会話をする時、その目的は何かを伝えることです。ではこの「何か」とは一体何でしょう?
例えば「今日、学校でこんなことがあったよ」と子供がお母さんに話すとき、その伝えたい中身は何でしょう?
「今日、学校の給食でプリンが出たよ」そう子供が言ってきたとき、何と答えてあげたらいいでしょう。
「学校給食が始まったのは、明治22年です」でしょうか?
そんなお母さんはどこにもいないでしょう。この時に、日本中のお母さんが答えたデータを全て集めて、正しい答えを統計的に計算しても何の意味もありません。
その子が聞きたい答えは、そういうものではありません。多分、こんな答えを聞きたかったのではないでしょうか。
「そう、プリンが出たの。よかったねぇ」
これであれば、子供が伝えたいことがしっかりと伝わっています。 子供が伝えたかったのは、プリンが出て嬉しかったということです。
「嬉しい」ことがあって、それをいち早くお母さんに伝えたかったのでしょう。それがしっかりと伝わって、「よかったね」と共感してもらい子供は安心します。
つまり、伝えたいこととは一言で言えば「感情」というわけです。「こんな楽しいことがあったよ」とか、「こんな悲しいことがあったよ」と言う感情です。 人は、感情が発生すると、それを人に伝えたいものなのです。単に、何か事実を伝えるということでは無いのです。
これで会話の目的は「感情」であることがわかりました。そしてもう一つ重要なポイントは、感情が行動と密接に結びついていることです。
プリンもらって「嬉しい」と言う感情が伝われば、笑顔になります。 学校の運動会で、徒競走のビリになれば「悲しい」と言う感情が発生して、 悔しがったり、泣きたくなるかもしれません。
「感情を発生して、それに基づいて行動する」これはまさに、「人間の心」そのものです。 この仕組みがわかれば、人間と同じ心を持って、人間と心を通わせることができるAIができる、と田方氏は言います。 これをプログラムに落とし込んでいけば良いのです。
意味理解の仕組み(アルゴリズム)
会話の目的は感情です。会話から感情さえ取り出せれば、AIでも雑談や日常会話が出来るようになる、と田方氏は言います。
さきほどの子供とお母さんの会話を図式化すると次のようになります。

太郎くんは学校で給食にプリンが出て「嬉しい」と感じました。 これは太郎君が頭の中で描いている「認知した世界」です。 これは、学校で給食にプリンが出たと言う光景の中に太郎君の「嬉しい」と言う感情が発生した場面です。
うれしかった太郎君は、早速家へ帰ってお母さんに伝えるわけです。「今日ね、学校でプリンが出たんだよ」 と。これは太郎くんの嬉しい感情を言葉に表したわけです。
この頭で思い描いている世界を「認知世界」と呼ぶことにします。 そして言葉で表す世界を「言語世界」と呼ぶことにします。
頭の中で感じた「認知世界」の感情を言葉にしたものが「言語世界」に投影されるわけです。これが最も基本的な、意味理解のアルゴリズムの図式です。
次に、お母さんの番です。「学校の給食でプリンが出たんだよ」って、言葉を聞いたお母さんは、頭の中で、学校でプリンが出ている光景を組み立てるわけです。
これがお母さんの認知世界です。言葉を認知世界に逆変換しています。

「そう、よかったねぇ」とお母さんは返します。
太郎くんは、それを聞いて、自分の嬉しい気持ちがお母さんに伝わったとわかって満足します。こうやって、自分の頭の中に発生した感情が、相手に伝わったかを確認しながら会話は進行していきます。
これに対して、AIが扱っているのは言語空間に限られます。 言語空間の中にある言葉のビックデータをいくら大量に、高速に計算をしても、自然な会話とならないことは、これでご理解いただけると思います。一番重要なのは、プリンが出て嬉しいと言う「感情」なのです。
重要なのは、「表面の言葉」ではなく、「頭で思う思い描いている中身」です。この「頭の中で思い描いている中身をコンピューターで再現」しようとしているのです。
それでは、コンピュータで何ができれば、人間と同じように意味が理解できたと言えるのでしょうか。
ドラえもんのこころの作り方: コンピュータで意味理解を再現する
会話の目的は「感情を伝える」ことです。会話から感情さえ取り出せれば、雑談や日常会話ができるようになります。 伝えたいのは感情です。
「感情を発生してそれに基づいて行動」する。これが「人間の心」です。つまり、「感情の発生→行動」の仕組み(アルゴリズム)がわかればAIと会話ができるのです。
田方氏はこれを「心理パターン」と呼ぶことにしました。
「感情」も「感謝」も、心の動きであり「心理パターン」です。人間の行動は「この心理パターン」で決まるのです。言い換えれば、人の言動の裏には、「心理パターン」が隠されていて、この心理パターンにもとづいて活動しているということです。
心理パターンには、恐怖、憧れ、嫉妬、今回、善悪など数十個から100個くらいあるといいます。
これまでの自然言語処理では、知識や常識を集め、これまで100万語以上をコンピュータに学習させてきました。 そしてまだ足りないと気づいて、今は1億語を目指していると言われています。
しかしこの心理パターンを使えば、わずか数十個のパターンを使ってコンピュータのプログラムに落とし込むことができるのです。これが意味理解のアルゴリズムです。
心理パターンの具体例
最も単純な心理パターンは「本能」です。
これは、「不快を避け、快を求める」ということができます。田方氏はこれを最も基本的な心理パターンとして「プラスマイナス感情」と定義しています。 これは生物の行動の基本原理であり、マイナス感情を避けて、プラス感情となるように行動するということです。
例えば、AI掃除機は電池が少なくなると充電ステーションに自動的に戻ります。これは生物がお腹が空くのと同じといえます。ですから、人間や動物と同じ心理パターンが実現できたと言えます。
「感謝」も心理パターンの1つです。
しかし、この心理パターンには相手が必要です。そしてその相手も「感謝」の心理パターンを持っていることが条件となります。お互いが同じ心理パターンを持っているもの同士でないと、コミュニケーションが取れないのです。
これは「社会的心理パターン」ということもできます。お互いに共通の心理パターンを持っているから、感謝されたり、怒られたりしたものは、その意味がわかるのです。
前述のペッパー君にはこれがありませんでした。ですから、最初は興味を持って会話を始めるのですが、すぐに、こちらの意図が伝わらないことがわかってしまいます。なぜならば、会話の答えに「正しい(最適な)」答えを返してくるだけだったからです。
田方氏は、ロボットが社会に受け入れられるには、人間と共通の心理パターンを持つことが必要だと言います。さらには、「善悪」を持たせることができれば、人間に危害を与えたり核戦争を起こすこともなくなると言います。
究極的には、 社会的心理パターンでも最も強力なのは、「恥」です。
人が社会に受け入れられるには、その時々の状況に応じてその周りの人との関係を理解して行動することが必要です。同様に、ロボットにもこれと全く同じ「恥」という「心理パターン」を持つことが社会に受け入れられる条件なのです。
このような深いレベルにまで、意味理解の検討が及んでいることに、非常に感心するばかりです。
AIが言葉を理解して会話ができるようになる時
田方氏は、現在のAI (ディープラーニング)には構造的な欠陥があるといいます。それは、言葉の意味理解をディープラーニングというアルゴリズムに無理やり落とし込んだ ことによります。
現実世界にあるものを、計算しやすいデータに加工したから、その段階で大事なものがごっそり抜け落ちてしまったのです。
では、AIが「人間と同じような知能」持つようになったと、どのようにしたら判断することができるのでしょう。
これには、現在のコンピュータの仕組みを予言したアラン・チューリングが開発したチューリングテストで行うことができるといいます。
チューリングは、コンピュータが発達すると、そのうち人間と同じ知性を持つようになるだろう。 そうなったとき、どうすれば人間と同じ知能を持てたと判定できるのかと考えたのです。
彼は、コンピュータの知能が人間に追いつくとは、どういうことかという問いを立てました。人間を成り立たせているものからできた、システムそのものを考えたのです。それは、人間社会そのものです。秩序だって保たれた人間社会の中にこそ、人間の本質があるからです。
人間社会を考えて、それを構成する人間をAIに置き換えてみます。そして社会が維持できたとすれば、そのAIは人間と同じ知能を持っていると言えます。
それを実現したのが チューリング・テストです。
「人間と同じ知能」かを判定するチューリング・テストとは
このテストでは、テストするAIと人間とを用意します。そして、チャットでその二人と会話して、どちらが人間で、どちらがAIか区別がつかなければ、そのAIは、人間と同じ知能を持っていると判断できる、というものです。
このチューリング・テストの秀逸なところは、テストの中に人間が組み込まれている点です。例えば、問題を解くという形式であれば、それで判断できる知能はその問題に依存してしまいます。
別の見方をすれば、人間の知能は人間にしか判断できないということです。人間とAIが会話して、その会話がずっと続くなら、そのAIは人間と同じ知能があると言えるのです。
また、チューリングテストが言葉を使っているのはには理由があります。それは、言葉を使うのは人間だけだからです。言葉を使って、自然な会話ができれば人間と同じ知能を持っていると言えます。
現在のAIは、将棋、囲碁、画像処理、翻訳、文章の作成や翻訳など、特定の種類の仕事に限られます。これは、「特化型AI」と呼ばれます。これに対して人間のように、何でもできるAIを汎用AIと呼びます。 これができれば、世の中は大きく変わると言われていますが、まだ実現できていません。
このためにAIが絶対に越えられないボトルネック、それは会話です。 もし、会話ができるAIができたらどうなるでしょう?それは、「汎用型AI」の実現です。
会話ができるということは、文章を読んで、意味を理解することができるということです。必要な情報を探し出してまとめることも、文章を書くこともできます。本当に弁護士の仕事がなくなります。
これはシンギュラリティー(技術的特異点)と呼ばれるものです。 技術的特異点の技術とは、 言葉の意味を理解する技術です。人間のように何でもできる汎用型人工知能とは、 人間のように会話ができる人工知能のことです。
田方氏の主催するロボマインド・プロジェクトがいかに高い到達点を目指しているかがよくわかります。
ロボマインド・プロジェクトはYouTubeで公開されています。ここまでの全体像については、以下の動画で詳しく説明されています。
70.【マインド・エンジン1】絶対不可能といわれていたコンピュータによる言葉の意味理解。ついに成功したので公開します。
次に、2つ目のブレークスルーである「2. 人工意識を作り出す」をみていきましょう。
2. 人工意識を作り出す
ロボマインド・プロジェクトの最終目的とは
田方氏は、ロボマインド・プロジェクトの最終目的は意識を持ったAIを作ること、つまり意識が認識する世界を再現することだと言います。
もちろん、現在のAIの技術では人工意識はまだ作られていません。田方氏は意味理解を実現するAIを作るために重要なのは、プログラムだといいます。
これをコンピュータで再現するには、人間にとって最も重要な機能が何であるかを解き明かす必要があります。
意識の仮想世界仮説と人工意識
前述の人間の会話に必要な意味理解では、認知した世界に発生する感情と言語世界に投影して伝えられました。そして、相手側では受け取った言葉を自分の認知世界に再変換して、感情を再現して相手の感情を理解しました。
これには目の前にあるものや今そこで起こっていることを「認識」する機能が必要です。これは「意識」と呼ばれる、目が覚めている時の状態の中で起こります。
これに対して、自転車や自動車を運転している時など、起きている間でも無意識でハンドルを操作していることもあります。
この「意識」と「無意識」は、脳の中で完全に分かれていて、全く別々に処理されます。意識のないとこに、 もう一人の自分 がいるとも言えます。意識のある自分と意識のない自分の二人の自分がいるのです。
「意識のある自分」は、表の自分で、見て感じる世界にいます。これに対して「意識のない自分」は裏の自分で、無意識に感じている世界にいます。
この無意識の世界では、外からの刺激を感じて敵から身を守ったり、生命を維持したりするために瞬時に反応する必要があります。
これに対して意識は、自分が感じた刺激を正しく理解するために作り出された世界だと田方さんは言います。もう少し正確に言うと「脳が作り出した幻想」です。これを田方氏は「意識の仮想世界仮説」と呼んでいます。
自然な会話をコンピュータとするのは、この意識の中の世界です。さまざまなものや事象から発生する刺激を感じて、人間の心理パターンや思考が発生します。
意識世界と言語世界がつながる時: マインドエンジンの誕生
これを先ほどのお母さんと子供の例で考えてみます。子供の意識の中に「嬉しい」などの感情が発生し、お母さんに伝えたくなります。家に帰って、これを「嬉しい」という言葉(自然言語)に変換してお母さんに伝えます。
意識の仮想世界に、学校、給食、プリンなどの状況があり、ここから感情が発生し、言葉に変換され伝えられる。これをコンピュータで可能にするのが、「マインド・エンジン」と呼ばれるシステムです。
ロボマインド・プロジェクトでは、この意識の中の世界を3DCG(3Dのコンピュータグラフィック)の世界を通じて再現し、プログラム化された仮想現実の中でシミュレーションしていくことができるのです。
田方氏はこれを「マインド・エンジン」と呼んでいます。つまり、コンピュータで作られた意識の中に「人間の心」を再現できるのです。そして、人間と会話をすることができるようになるのです。
マインド・エンジンの解説動画シリーズ紹介
これ、一体全体どのようなものなのでしょう?確かめたくなりますよね。
田方氏は、これを自らが出演するYouTubeの動画シリーズで、詳しく解説しています。
それぞれのリンクをクリックして確認してください。田方氏の個性あるお人柄と熱意がヒシヒシと伝わってきます。
少しオタク感満載といった感じですが、ブレークスルーというものは、こういったところから生まれてくるのでしょう。要確認です。
●ロボマインド・プロジェクトとマインド・エンジンの基本的な説明
(なぜ、これまでのAI開発や自然言語の研究ではコンピュータで会話ができないのか?)
100. 【マインド・エンジン3】まさに、ロボットの心!実演解説、コンピュータが言葉の意味を理解して、恐怖が生まれるまで・・ ・
●マインド・エンジンの補足的な説明
(ゲーム開発とAIで自然な会話をすることの関係とは?)
101.【マインド・エンジン4】キズナアイの心はマインド・エンジンで作れるか?!
●マインド・エンジンの2021年11月現在の最新情報
(意識の仮想世界でコンピュータが会話の意味を理解して会話を始める)
207.【マインド・エンジン12】第二章 ロボマインド・プロジェクト再始動
結論:
本書には人工知能(AI)、自然言語、意識、認知など、普段はあまり考えたことのない専門用語がぞくぞくと出てきて、間違いなく混乱する内容です。
しかし、よくよく考えてみれば、私たちは新しい技術の登場によって、これまでに何度も仕事や生活が激変するという経験をしてきました。そういった実際の現象の中で、これは間違いなく一大事となる可能性があるものだと言えます。
ですから、今すぐにでも確認しておく必要があります。
だって、ドラえもんが登場するかもしれないんですよ。もちろん、どこでもドアやタケコプターのような魔法のようなツールをポケットから出してくれるわけではありません。
でも、そんなことが起こりそうな気になってくるのは私だけでしょうか。その後からも続々とドラえもんの世界が起こってくるような、そんな入り口の出来事なのかもしれません。
YouTube動画の【マインド・エンジン4】で田方氏が説明するように、ゲームの3DCGの世界(仮想世界)の中でコンピュータにオブジェクト(物や人の認知)を理解して、感情や行動(心)をプログラムで定義してあげれば、確かに実現しそうな気がしてきます。
意識や無意識といった説明も、なんとなく日頃感じていることと、そう乖離しているわけではありません。
実際に、私たちが今ではスマホやゲーム機で普通に遊んでいるゲームの世界は、現実そっくりの現実ではない仮想世界です。それが既に作り出されているのです。
でも、そこで交わされる登場人物との会話は、すべてあらかじめ決められたスクリプト(決まった会話の文章)です。
このゲームの相手とのやりとりが、「マインド・エンジン」が入れば、こちらの心を理解してくれる会話にもう少しでできそうな気がしてくるのは筆者だけでしょうか。このプロジェクトがどう進んでいくのか、非常に興味を持って見守っていきたいと思っています。
田方氏は、毎回の動画のところでも言っていますが、この、これまで誰も考えることもなく、研究の対象にもなってこなかったアプローチが間違っているのか、是非とも意見交換したいと言っています。
最先端の研究をしている方、あるいはベンチャーキャピタルの方など、是非とも一度確認していただけたらと思います。
あなたの感想をお寄せください
この記事を読んだ感想を是非とも下のコメント欄からお寄せください。コメントは必ず目を通しています。あなたの感想をお待ちしています。
このレビューを書いた人:
大山賢太郎
著者: デジタル読書のすすめ: 深層読書とナレッジベースがあなたの脳を覚醒する
コメントを残す