対話型の文章生成AIとして一世を風靡したChatGPT。その専門家は、AIがこれから作る未来をどうみるか。
——本日はよろしくお願いします。まず初めに、専門家の視点からみて、現在のAIはどのような状況に達 しているとお考えでしょうか。
古川:まず画像認識AIの話でいえば、2012年に米国の画像認識AIのコンテストがあって、そこからいわゆるディープラーニング、深層学習という手法が広まり、画像認識率が急激に上がりました。そして2015年には、すでに人間の認識精度を超えているんですね。
テキスト領域では、2020年の6月に、ChatGPTを作っているOpenAIがChatGPTの前身にあたる『GPT-3』 を発表しています。2020年ぐらいから大規模言語モデル、『LLM』といわれるものが出てきて、GPT-3は1,750億という膨大なパラメータを持っていました。
この段階からもう人が作った文章とは、見分けがつかないクオリティには達しています。実は技術的には2010年代後半からすでにクオリティは大きく上がっていて、もちろん精度は現在も上がり続けていますが、ここ半年で何かの性能が急激に上がったという話ではないんですよね。
今のこのChatGPTの盛り上がりに起因しているものは大きく2つあって、1つがやっぱりチャットという会話型のインターフェースを一般の方が気軽に触れるようになったこと。もう1つが日本語で入力して日本語で返ってくるという、言語の壁がなくなったことです。
従来の対話型AIでも日本語の入力はできましたが、やはり英語の方がスムーズな返答が返ってきていたので。
バーチャルアシスタントとしての対話型AIの活用がビジネスに浸透する
——ChatGPTで一般的にも広がった対話型AIですが、今後は対話型AIがあたらしい仕事やビジネスを生み出していくのでしょうか。
古川:よくいわれる話ですけど、対話型AIという形でいえば、すべての人に仕事のアシスタントやパートナー、優秀な部下であり同僚であり、先輩のような存在ができるということになると思います。ここがおそらくビジネスとして活用できる基本の1つになると思っていますね。
人間のパートナー、後輩や先輩との違いでいえば、たとえばあたらしい職場で先輩に業務資料をわたされて『わからない所があったら聞いてね』といわれたとします。でもいざ質問しに行こうとすると、その先輩が電話中だったり、難しい顔で作業に集中していたりして話しかけにくい。
そういった時に、その業務資料を学習させているAIに、細かい質問を気軽にできる。罪悪感や恥ずかしさとか、そういう感情を持つことなく、いつでも何度でもコミュニケーションが取れるわけです。それによりメンバー間の情報共有も進んで、結果としては業務の手戻りなども減り、コストが下がりますよね。
対話型AIは『本の擬人化』などとも呼ばれますが、業務全体だけではなく、それぞれ特定の専門の知識を持ったAIを別々に使い分けることもできます。たとえば広報のTwitterでどういうツイートをしたら効果的で、炎上しにくいか、ということは、これまでのツイートも把握しているSNS運用に詳しいアシスタント AIに聞く。
こうした社内ドメインの知識を持ったバーチャルアシスタントという存在は、産業を問わずあたらしいビジネスとして広がっていくんじゃないかと思います。
——ChatGPTの登場で対話型AIの存在は広まりましたが、それでもまだITやデジタル分野に強い人以外には知られていない印象も受けます。
古川:そうですね。今年の4月にOpenAIの最高責任者のサム・アルトマン氏が来日された時に、自民党の会合で『日本でのユーザー数は100万人を超える』と発言していました。2022年の労働人口が6,700万人なので、パーセンテージでいうと1.4%ぐらい。
いわゆるキャズム理論みたいな話でいうと、多分上位2.5%くらいなんで、本当にまだまだ、黎明期オブ黎明期ぐらいの段階だと思ってます。
ではそこからデジタルツールに馴染みがない人に、どうやって広がっていくかという話だと、Microsoftが「Microsoft 365 Copilot」という、要はWordやExcelなどのソフトに生成AIやAI機能をどんどん取り入れていくと発表しています。
そうするとMicrosoftのプロダクトを通じて、AIというものに触れていく。そのなかでは、おそらくChatGPTとか意識しない状態だと思うんです。『なんか短い文章入れたら、長くしてくれるよね』とか、『雑な文章入れたら大事なところだけ抽出してくれる便利な機能だよね』とかそういうものとして溶け込んでいく。
国内だと上場企業の20%から30%くらいがMicrosoftのプロダクトを使ってると思うので、意外と早い段階で、既存のプロダクトを通じて空気のように浸透していくだろうという風に考えてますね。
ChatGPTのイメージは「知識をめっちゃ持っている酔っぱらい」情報の収集ではなく、加工をする場所。
——「本の擬人化」という単語をいただきましたが、一般ユーザーからすると対話型AIは「使いやすいwiki」という印象も強いかと思います。ここが対話型AIの持つ本来の利点なのでしょうか。
古川:まだ黎明期ですから一般の方がどういうイメージを持っているかすらもない、というフェーズであることはまず前提としてあります。
その上で私から特徴をいうと、先程もいったように、あくまでChatGPTはアシスタントなんです。こちらがブラウザで入力、質問をすると答えるという一連の動きは、ChatGPTからしてみるとテストなんです。
当然テストを受けるためには、ChatGPTはテスト勉強をしているわけですね。どうやってテスト勉強をしているかっていうと、ひたすらネットにある何かを検索して、URLを上から順番に片っ端から全部頭に突っ込む、みたいなことをやっていると。
ただ頭に詰め込んでいるだけで、辞書のように体系的に何か知識を体系的に学んでいるわけではないので、間違えることもします。
こういう風に考えると『知識をめっちゃ持ってる酔っぱらい』みたいなイメージのものなんですよ。すごい賢いんだけど、酔っ払ってるから、まともなことをいう時もあれば、わけのわからないこともいう。まずそういう風なイメージを前提として持つのがいいいと思います。
もう少し正確な表現をするならば、ChatGPTというのは『情報を収集する場所』ではなくて、『情報を加工する場所』なんです。
何かメール文章を作ろうとした時に、ChatGPTに丁寧なメールを作ってもらうこともできます。しかしそれは、Google検索でメールの雛形やテンプレートを調べて使うのと別に変わらないですよね。なので大事なのは加工の部分なんです。
加工ってどういうことかっていうと、たとえばメールの雛形をTPOや場面に応じて文章のトーンを変える。つまり文章のリライトや書き直しです。そういう何か素材があって、それを加工する場所として非常に優秀なんです。
——日本でも5月頭に『第1回AI戦略会議』が開催され、政府としてもAIに対し積極的な姿勢をみせています。AIの普及によって日本経済に良い影響はあるとお考えでしょうか。
古川:いろんな観点があるとは思いますけど、これも大きく2つあります。1つはそもそも、LLMにおけるOpenAIやChatGPTという存在が、スマートフォン時代におけるApple Storeのようなものなんですね。つまりプラットフォームを国外に握られている状態。
なのでそもそもまず、ルールの上で戦うことも大切だと思いますが、まだまだ黎明期なのでルールメーカーに回る。
最近だとSoftbankとLINEが共同で和製GPTを作ると発表しています。データも資本力もある企業がLLMモデル自体の開発に参入する、という動きは非常にありがたいと思っていますね。海外のプラットフォームに乗っかるだけではない、ということをまず前提として守っておく必要があると。
そうした大きい話があった上で、2つ目の観点としては、AIというのは一種の、外からの強制的な圧力になるという意味では良いと思っている点です。
個人的には、AI自体によって何か劇的に変わることはなく、『DXの手段としてのAI』という位置付けが大きい思っているんです。
国内におけるDXの話は『デジタル・トランスフォーメーション』において『デジタル』と『トランスフォーメーション』をわけた時に、デジタル化というのは、たとえば紙の書類をデータ化してインターネット上にアップするとかの話になります。
トランスフォーメーションっていうのは、ビジネスモデル自体や自社の利益構造そのものを変えていこう、という話です。
3月にIPA(情報処理推進機構)が出した『DX白書2023』のなかで、DXにおいて日本が今、できている部分とできてない部分っていうのが、非常に明確に出ています。できてる部分というのは、業務の効率化や生産性の向上、つまりデジタル化の領域は米国と比較しても、ほぼ同じくらい成果が出ている。
一方で、できてない部分がまさにトランスフォーメーションの部分です。具体的には『何かあたらしい製品を作る』『サービスを生み出す』『ビジネスモデルを変える』といったことですね。デジタル化はできているけど、トランスフォーメーションできてない。これがそもそも現状の課題としてあります。
この状況に対して、AIやLLMが入ってきたことにより『これだけ簡単に文章が作れる』というイメージができあがりました。そのなかでLLMを利用してコストを急激に下げられそうなセクションが出てきたり、あらたな不可価値を付けられる商品も出てきます。
そうすると、それを活用してあらたなサービスを提供する企業も増えてくる可能性があります。DXにおける足りなかったパーツが、ジェネレーティブAIによって補えていけるので、まさにトランスフォーメーション化っていうのが加速する。
そういった観点から、国内全体の経済成長における1つの起爆剤にはなり得ると考えていますね。
「Text to VR」のジェネレーティブAIがメタバースの世界を低コストで作るその筋道はすでにみえている
——「ChatGPT以後」となった現在、注目しているのはどのような分野でしょうか。
古川:先程ChatGPTは加工が得意という話をしたんですけれど、いわゆるジェネレーティブAIをプロダクトで分類する時はたとえば『Text to Image』とか『何から何』っていういい方をするじゃないですか。
結局はそれが、全部組み合わさるのが最終形態で、究極的にはいわゆるブレインマシーンインターフェースを使って、脳で考えてそのシナプスのパターンを読み取って生成するところまで行ってしまう。
それは遠い将来の話ですが、もう少し手前でいうと、現在は言語モデル、テキストに注目が集まってます。この次は画像ですよね。GPT-4であれば、すでに画像を入力に使えます。
これがどういうことにつながるかというと、たとえばカメラの映像をリアルタイムにLLMに流して解析できるわけです。たとえば写った相手表情や声のピッチが変われば、これは嘘ついているかもしれない、と分析できる。
『マルチモーダルAI 』といわれるように、現在テキストが非常に発達しているところに、画像、そしてそれの連続データとしての映像、動画。そしてその動画の次にいわゆる3Dが出てきて、3Dの次に、AR、VRみたいなところまでつながっていくことになります。
自分もVRは好きなんですが、VR元年が何回あるんだとも思っていて、今現在でいえばジェネレーティブAIに話題性では押されています。これは結局、キラーコンテンツがないことが原因の1つだと思うんです。もちろんハード自体の問題もあると思うんですけど、キラーコンテンツがあればハードもしっかり売れる流れが出ると思います。
では、何故キラーコンテンツがないかといったら失礼ですけど、少ないかというと、単純に製作コストが高いことも理由だと思っています。スマートフォンのカジュアルゲームでも、1個作るのってもう20億円、30億円かかり、それも当たるかわからない。
VRゲームを製作する時って、UnityとかBlenderなどのソフトを使うと思うんですが、人的なコストがかかるし時間もかかる。それがジェネレーティブAIによって「Text to 3D」「Text to VR」のように製作状況ができると、VRのコンテンツの製作コストが大幅に下がる。
コストが下がって量が増えれば、そのなかに当然、質の良いものも出てきてくる。それがキラーコンテンツ化し、ハードも売れていく。
なので私が個人的に今、非常に期待しているのは、『Text to 3D』『Text to VR』という分野です。私自身も実は、そっちの事業を狙っているというのもあります。ビジネス的なインパクトとしてもありますしね。テキストからテキストを作るのって、情報量でいえばそんなに変わらないんです。
一方でテキストだけ入れて3Dができるっていうのは、情報のレバレッジっていうものが圧倒的に1番大きいわけじゃないですか。なので『Text to VR』が今1番熱いと思います。
そこからやっと、メタバースにも間違いなくつながっていく、世界を簡単にテキストで、テキストから世界を生み出せるようになるっていう世界観が必ずくる。そしてその道筋はみえてきてるんで、ここが非常に熱いと思ってます。
Book Review
『先読み!IT×ビジネス講座 ChatGPT 対話型AIが生み出す未来』
自由度の高い会話をしながら、自然な文章が生成されることで大きな注目を集めている対話型の文章生成AI、「ChatGPT」について専門家の解説で読みやすく、詳しく学べる一冊。
コンパクトでサクッと読める形式ながら、ChatGPTの実力から可能性、技術的背景までをしっかりと解説してくれるほか、実際の使い方や活用方法、ビジネス用途の具体的な事例も掲載。
Profile
◉古川 渉一
1992年生まれ。鹿児島県出身。 東京大学工学部卒業。株式会社デジタルレシピ取締役・最高技術責任者。パワーポイントからWebサイトを作る「Slideflow」 やGPT-3を活用したAIライティン グ「Catchy(キャッチー)」を立ち上げ。著書「先読み!IT×ビジネス 講座 ChatGPT 対話型AIが生み出す未来」は6万部を突破。
関連記事
識者談「今、この人のハナシを聞きたい」——大井基行
識者談「今、この人のハナシを聞きたい」——藤野周作