人工知能の権威レイ・カーツワイルが、グーグルで「メールの自動返信」を開発する本当の狙い

「シンギュラリティ」という概念で有名になったレイ・カーツワイルはいま、グーグルでメール返信文の自動作成機能を開発している。その最終的な目標は、なんと「人間並みに言語を理解できるAI」の開発だった。その“野望”について、カーツワイルが語る。
人工知能の権威レイ・カーツワイルが、グーグルで「メールの自動返信」を開発する本当の狙い
PHOTO: GETTY IMAGES

All products are independently selected by our editors. If you buy something, we may earn an affiliate commission.

レイ・カーツワイルはこれまでに、さまざまなものを発明してきた。10代でクラシック音楽を作曲するコンピューターを制作し、当時のリンドン・ジョンソン米大統領から賞を授与された。20代になると、印刷された文字をデジタルデータに変換できるソフトウェアを開発し、30代のときにはスティーヴィー・ワンダーと組んでシンセサイザーの会社を設立した。

最近では、シンギュラリティ(技術的特異点)[日本語版記事]という考え方を世に広めたことで知られている。シンギュラリティとは、高度な知能をもつ機械が、将来のある時点で人類に変革をもたらすときが来ることを意味する言葉だ。シンギュラリティが訪れれば、不老不死も夢ではないとカーツワイルは予測している。

とはいえ、69歳になった彼のいまの仕事は、グーグルで35名ほどのスタッフを統率することだ。このチームは、メール作成を支援する機能を開発している。

人間並みに流暢に言葉を操るソフトウェアを

カーツワイルらがつくっているのは、「スマートリプライ」と呼ばれるGmailモバイルアプリの機能だ。返信メールを作成するユーザーに3種類の返信文を提案し、タップ操作で文章を選択できるようにする。スマートリプライは、5月に英語版Gmailの全ユーザーに提供されたあと、7月にはスペイン語ユーザーにも提供された。

作成される返信文は、「月曜日にやろう」「イェイ!それはすばらしい!」「また来週」といった短い文章が多いが、それでも十分に役立つ(もちろん、送信前に文章を編集できる)。カーツワイルはこの機能について、「AIが人間の知能とうまく連携した素晴らしい例です」と語っている。

彼のチームは現在、スマートリプライ機能を強化し、もっと複雑な文章を最初から提案できるようにする実験を行っているところだ。たとえば、「もちろん、パーティーに行くのを楽しみにしてるよ!」という文章を入力してから「Continue」(続き)ボタンをクリックすると、「何か持っていくものある?」といった文章を追加できるようになるかもしれない。

カーツワイルは、ユーザーが文章を入力したら、そのあとに続く文章をAIがいつでも提案できるようにしたいと考えている。「文章をどのように完成させるのか提案することで、ドキュメントやメールの作成を支援してくれるテクノロジーが登場するかもしれません」とカーツワイルは語る。

カーツワイルはさらに先を見据えている。彼いわく、スマートリプライは彼のグループが手がけている本来のプロジェクトにとって、目に見える最初の成果に過ぎない。「Kona」というコード名をもつプロジェクトでカーツワイルたちが目指しているのは、われわれ人間と同じくらい流暢に言語を操るソフトウェアを開発することだ。

「人間並みとまでは言いませんが、われわれはいずれその目標を達成できると考えています」と、カーツワイルは語る。彼の言うことは、信じるに値するだろうか。それを判断するには、カーツワイルがこれまでに、いかに人間の知能の働きに関する謎を解き明かしてきたかについて考える必要がある。

グーグルにカーツワイルの理論をもたらす

グーグルの共同創業者ラリー・ペイジは、2期目のCEOを務めていた2011年から2013年にかけて、いくつかの驚くべき構想を進めていた。ロボット企業の買収、アンチエイジングを研究する新部門の立ち上げ、不幸な結果に終わったバージ船建設プロジェクトなどだ。そして、2012年にレイ・カーツワイルをグーグルに招いたことも、物議を醸したペイジの企てのひとつだった。

当時のグーグルは、機械学習やAIの分野で大きな影響力をもつ思想家たちをすでに迎え入れていた。また、新しい製品を動かす機械学習システムの開発に携わるエンジニアを次々と採用していた。そのなかでカーツワイルは、人が自分の精神をサイバー空間にアップロードするようになるという奇妙な未来を予測した著書で有名になった人物だ。研究や今日の仕事に役立つAIシステムの開発で名を馳せたわけではない。

だがカーツワイルの話によれば、その本がグーグルで働くきっかけのひとつになったという。ペイジはカーツワイルを本社に招き、当時間もなく刊行予定だったカーツワイルの著作『How to Create a Mind』に書かれていたアイデアについて話し合った。2012年に出版されたこの本は、大脳新皮質の働きに関するカーツワイルの理論をまとめたものだ。大脳新皮質は脳の外側にある部位で、人間の知能の中核を成している。

「簡単に言えば、ペイジがわたしを採用したのは、わたしの理論をグーグルにもたらすためでした」とカーツワイルは振り返った。「このモデルを機械学習に適用すれば、言語を非常に深く理解できるようになるとわたしは主張したのです」

カーツワイルの理論では、大脳新皮質は多くの回路の繰り返しで構成されている。情報のパターンを認識する能力をもつ小さな回路が、階層状に積み重ねられているというのだ。カーツワイルによれば、それほど高度な機能をもたないモジュールがたくさん集まることで、抽象的な処理を行う能力や人間の知能を特徴づける論理的思考能力を実現している。

ただしこのモデルは、人間の脳を研究している人々の間で広く受け入れられているわけではない。認知科学を専門とする大学教授のグレイ・マーカスは、『How to Create a Mind』の書評のなかで、この理論は独創性に欠けており、実験的な裏付けも不足していると指摘した。

だが、カーツワイルの考えは異なる。彼は、この本が14歳のときに自身が考えた脳に関するアイデアをまとめたものだと認めながらも、「わたしの理論を支持する神経科学的エヴィデンスは急速に増えています」と語った。カーツワイルによれば、知性に関する彼の階層理論がKonaシステムの基本理念になっているという。

“省エネ”なスマートリプライ

現在のスマートリプライ機能は、カーツワイルのグループがつくったコードで動いている。だが、最初にスマートリプライを開発したのは彼らではない。スマートリプライの開発を始めたのは、Gmail製品チームと、グーグルのAI開発チーム「Google Brain」に所属するエンジニアと研究者だった。

彼らは、グーグルの画像検索サーヴィスや音声認識サーヴィスの改良に利用された人工のニューラルネットワークに多くの事例を学習させることで、返信メールも作成できることを実証し、2015年後半にこの機能を「Inbox」に追加した[日本語版記事]。Inboxは、グーグルがリリースしたもうひとつのモバイルGmailクライアントだ。そのおよそ半年後には、Inboxアプリで送信された全メールの10パーセントでスマートリプライが使われるようになっていた。

そしてカーツワイルのグループは、Inboxよりはるかに人気が高い標準のGmailアプリで、ユーザーにスマートリプライを提供する取り組みにかかわることになった。

初期のスマートリプライは、大量のコンピューティングパワーを必要とした。単語が出現する順序を認識するために、ある種の短期記憶システムをもつニューラルネットワークを使用していたためだ。このテクノロジーは、文章の意味を理解するのが得意なため、「Google翻訳」でも使われているが、多くのコンピューティング資源を消費する。

カーツワイルたちがつくり直したスマートリプライも、ニューラルネットワークを使用している。だが、単語の順序を認識しないため、はるかに安いコストで動かすことができる。電子メールの本文または件名に含まれる単語を次々と取り込み、まとめて数字に変換するのだ。

また、このニューラルネットワークは二層構造になっている。下の層がメールに含まれるテキストを取り込むと、上の層がその結果を分析し、あらかじめ作成された29万種類の返信文から最も適切な文章を選択するのだ。これらの返信文リストは、Gmailユーザーの間で最もよく使われるフレーズを分析してつくられた。カーツワイルのグループが5月に発表した論文によれば、ユーザーがよく使う返信文をわずかなコンピューティングパワーで提案できるという。

転換期は2029年

スマートリプライは素晴らしい機能といえる。だが、ソフトウェアがいまよりはるかにうまく言語を理解できるようになることを証明するには、まだ長い道のりがある。

イスラエルのテルアヴィヴにあるバル=イラン大学で自然言語処理を研究するヨアフ・ゴールドバーグは、新しいスマートリプライ・システムに関するグーグルの論文について、大きな科学的進歩を説明したものというよりは、堅実なエンジニアリングについて書かれたものだと評している。グーグルのような企業は、機械学習をどこでも利用できるようにするという目標を達成できることなら、とにかく毎日のように取り組み続ける必要があるのだ。

「ほとんどの問題において、われわれが必要としているのは確立した手法を用いる技術的に優れたソリューションであって、いままでにない画期的なアプローチではないのです」とゴールドバーグは語った。

カーツワイルは、自身のチームが開発しているシステムと人間の脳には類似性があると主張する。しかし、この説にどれほどの信頼性があるかはわからない。

階層構造を使ってデータを次々と取り込み、意思決定に利用できるようなより抽象的な表現に変換するという点では、確かに両者は似ている。だが、人工のニューラルネットワークを使って構築された機械学習システムは、すべてそのような構造になっているといえる。まだ実現できていないのは、人間の脳に非常によく似たシステムなのだ。「その類似性はあまりにも漠然としており、実質的には(類似性は)認められません」とゴールドバーグは語った。

それでも、自説の正しさを証明できるというカーツワイルの自信が揺らぐことはない。「数学的には類似性はありませんが、その概念は大脳新皮質を機能させているものと同じだと確信しています」と彼は述べた。「それに、われわれのテストをモデルとしたこのシステムが、実際に言語の意味を取得しているのです」

カーツワイルは現在、Konaを使った新しいアプリケーションを開発しており、将来のグーグル製品としてリリースすることを明言している。また、その先について問われたカーツワイルは、議論を呼びそうな予測をあっさりと口にした。

「わたしの予測は数十年前から変わっていませんが、2029年にはコンピューターが人間並みに言語を理解するようになるでしょう」。もしそうなれば、カーツワイルのコードは、メールの文章を書く以上のさまざまなことを実行できるようになっているはずだ。


RELATED ARTICLES

TEXT BY TOM SIMONITE

TRANSLATION BY TAKU SATO/GALILEO