AI

「AIがなぜブームに?」「何が作れる?」意外と知らない「現場」のハナシ。——AI Engineer

2023/05/29Iolite 編集部
SHARE
  • sns-x-icon
  • sns-facebook-icon
  • sns-line-icon
「AIがなぜブームに?」「何が作れる?」意外と知らない「現場」のハナシ。——AI Engineer

なぜ今「生成AI技術」がブームなのか? その可能性と危険性とは

昨今、ChatGPTに代表される生成AI技術が注目を浴びている。文章だけではなく、イラスト・プログラム・3Dモデルなど、生成AIはさまざまなクリエイティブな表現が可能になっているからだ。

「多くの人間の職を奪う」とまでいわれている生成AIによって、我々の生活やビジネスにどのような変化が起きるのだろうか。

——本日は最近話題になっているAI技術についていろいろと質問させていただきます。そもそも、なぜここ数ヵ月ほどでこれほどAIが話題になっているのでしょうか?

B氏:きっかけは2022年の7月から8月にかけて『Midjo urney(ミッドジャーニー)』や『Stable Diffusion(ステイブルディフュージョン)』といった画像生成AIサービスがリリースされたことです。これらのサービスはいくつかのキーワードを入力すれば、適切な画像を自動的に生成してくれるというものでした。

まったく絵が描けない人でも、まるでプロが描いたかのような画像を数秒で作成できるという革新的なサービスですね。ただし、これらの画像生成AIサービスはIT技術に興味を持つような一部の人たちから注目を浴びていたという印象です。

それがより多くの人に広まったのは、昨年11月にリリースされた『ChatGPT』というサービスからでしょう。このサービスはユーザーから与えられた質問文に対して、まるで人間が作ったかのような自然な文章で回答できることが話題になりました。

ChatGPTは瞬く間に世界中で使われるようになり、今年1月には月間で1億人のアクティブユーザーがいると発表しています。

A氏:以降、生成AIサービスは世界中で次々と立ち上がっています。最近では検索エンジンを提供している企業が、生成AIを活用したサービスを立て続けにリリー スしました。

MicrosoftはChatGPTを支える技術である大規模言語モデル『GPT-4』をベースにした『新しいBing』、Googleは『Bard』をリリースしていますね。いずれも、ユーザーからの質問に対してインターネット上の 検索結果を踏まえた回答を生成してくれます。

B氏:今ブームになっているのは『AI技術』というよりも、『生成AI技術』です。AI技術はすでに数十年前から開発されており、『AIが人間を超える』だなんて話を過去に耳にしたことがある方も多いでしょう。

たとえば画像をみて、その情報を解析するようなAI技術はすでに発展していました。ほかにも将棋AIのように特定の分野において人間を凌駕するようなシステムもいくつか誕生しています。

それが2023年に入ってブームになっているのは、人間と同等か、あるいはそれ以上のモノをAI が生成できるようになったからです。文章や画像、さらに小説やプログラミング、3Dモデル、音楽など、これまで『人間にしかできないクリエイティブな活動』とみなされていた分野にもAIが進出するようになりました。

これまでのAI技術は、データを認識することは得意でしたが、それを人間と同じレベルで出力することは苦手でした。特に自然言語処理と呼ばれる、人間が作るような自然な文章の作成はAIには難しい作業でした。ところが、『Transformer』という技術によって、それが可能になったのです。

この技術はもともとはGoogleが翻訳に関する研究をしている過程で論文として発表したものですが、それがAIに応用された結果、人間が書いたような文章を作ってくれる生成AIサービスが生み出されたんです。

——ChatGPTが話題になったころに、試しにいくつか質問をしてみたところ、的はずれな回答をもらうことがありました。それをみて、AIといっても間違いを起こすし、あまり信頼できるものではないという印象があります。

A氏:ChatGPTのような文章生成AIは大量のテキストデータを学習して、それをもとに『適切であろうと予想される』回答を生成する技術です。なので質問内容に関して十分な学習データがなければ、回答を誤る可能性はあります。

実際、ChatGPTの場合は2021年9月までのデータを学習してるため、2022年以降に起きた時事問題などについてはまったく見当違いな回答をすることがありました。

B氏:生成AI技術に関して、よくある誤解として、『人間が知らないような物事の正解を教えてくれる』といった認識があります。これは誤りで、生成AIはすでに存在している大量の学習データをもとにして出力をするので、学習データに存在しない情報についてはもちろんAIも知らないんです。

ちなみに、質問に関する回答が的外れになってしまう問題や最新の時事情報に疎いという問題については、インターネット上の膨大な検索結果をもとに回答する『Bard』や『新しいBing』ではかなり解消されています。

AIによって職を奪われるようなマイナス面もあるが、使いこなすことで業務を効率化したり、あらたなビジネスを生み出したりもできる

——では、ここからは生成AIによって具体的にどのよう なことが可能なのかを教えてください。

A氏:生成AIはさまざまな種類のサービスが誕生していて、できることも非常に幅広いので、まずは文章の生成AIについて話しましょう。文章生成AIなので、もちろん人間が書いたかのような文章を生成できます。

たとえば、ブログ記事や、メール、レポートなどは、適切なテーマをあげて質問すれば、それらしい文章を書いてくれます。すでにウェブ上ではブログ記事をAIで量産して自分のサイトを作っているような人も増えていますね。 メールやレポート作成は、ビジネスにおいても活用できるでしょう。

B氏:ほかにも、自分があまり理解できていない事柄に関して生成AIに質問する、という使い方もあります。すでにMicrosoftやGoogleが生成AIサービスをリリース していますが、生成AIの登場によってインターネット検索が大きく変わりつつあります。

これまではキーワードを検索エンジンに入力して、大量に表示されるウェブサ イトのなかから自分が求める回答を探していましたよね。ところが生成AIによって、検索結果から要点だけを抜き出した回答がもらえるようになったんです。

このような使い方は『知らないことを調べる』という行為だけではなく、『外出の計画をたてる』といったことにも使えます。たとえば『新しいBing』で『予算1万円で2人でご飯に行くならどのお店に行けばいい?東京にあるお店を3つあげてください』と入力すると、具体的な店名を3つ教えてくれます。

個人的には、文章生成AIはインターネット検索の革命でもある、と考えています。

A氏:生成AIを使ってプログラムのコードを書いてもらったり、レビューしてもらうこともできます。たとえば『Windowsのメモ帳のようなアプリのコードを書いてください』と指示すれば、そのまま使えるようなコードを生成AIは出力してくれます。

そもそもプログラムについては、誰かが書いたコードをみて学んだり模倣することが当たり前なのですが、生成AIを使えば一瞬で簡単にその答えを提示してもらえるんです。

B氏:最近ではGoogleがAIベースの開発支援機能『Duet AI for Google Cloud』というものを発表しています。このサービスを使えば、AIとチャットして自分の要求を伝えることで、コードを書くことなくアプリケーションを作成できるようになっています。また、自分が書いたコードを入力することで修正案やバグを教えてくれ ます。

——ライターやプログラマーの仕事がAIに奪われる、というような状況が本当に始まっているんですね。では、画像生成AIではどのようなことができるのでしょうか?

A氏:名前の通り、さまざまな画像を生成してくれる技術です。画風も幅広く指定できて、リアルな写真のような画像を作ることもできますし、アニメ風の萌え絵を作ることもできます。画像生成AIはすでに多くのサービスが誕生して、作りたい画像の画風などに合わせてサービスを使いわけるようになっていますね。

B氏:代表的なサービスとしては先にあげた『Midjourney』や『Stable Diffusion』があります。また、この2つは日本語による入力に対応していないのですが、日本語入力に対応しているサービスも次々と誕生しています。

『にじジャーニー』やMicrosoftが提供している『Bing Image Creator』などは日本語に対応していて使いやすいはずです。

A氏:画像生成AIを使えば、イラストや画像の作成をAIに代行してもらうことができます。たとえばウェブサイトのバナーやSNSのアイコン、プレゼン資料に差し込む画像なども作成できますね。これまで写真素材サイトで購入していたような画像も、生成AIに作ってもらえます。

B氏:画像生成AIもここ数ヵ月ほどで飛躍的に発展しています。今年に入った頃は、『AIは人間の手を描写するのが苦手』といわれていて、実際に人間を描かせると指の本数や手の形に違和感があったんです。

なぜこうなってしまうのかを言語化すると、AIの場合は『人間には5本の指がある』ということを認識して画像を描いているのではなく、多くの画像をパターンとして認識して『人間は手の先が枝分かれしているが、画像によってはそれが5本みえてることもあれば、3本しかみえていないこともあるし、時には上半身しか写っていないから手がないこともある』と学習しているんです。

つまり『人間の手は5本である』と認識するための学習データが十分ではないため、現実とは異なる描き方をしてしまったということです。ところが、このような問題も数ヵ月で技術がアップデートされて、今では違和感がない手を描けるようになっています。

A氏:イラストや写真などを仕事にしている方にとっては、AIは非常に脅威となるものになっています。最近では、生成AIを使ってリアルな人間の画像を作り、それを写真集として販売する人もあらわれました。イラストについても、生成AIで作成したものを販売している人もいます。ただ、これについては著作権などの問題でネット上で炎上していますが。

——著作権などの問題については後ほど詳しく聞かせてください。そのほかにはどのようなものが生成AIによって作られているのですか?

A氏:音楽を自動生成するようなサービスも誕生していて、たとえば5月11日にgoogleが『MusicLM』という音楽生成AIサービスを公開しました。音楽生成AIでは『勉強に集中するための穏やかなバラード』などの指示を出せば、それに適した音楽を作って流してくれるようになっています。

ChatGPTのような文章生成AIに作詞し てもらい、ボーカロイドのような合成音声技術を組み合わせれば、人間が歌うような楽曲すら誰もが簡単に作 れるようになっています。

B氏:3Dモデルを自動生成するようなサービスも生まれています。ChatGPTを開発しているOpenAI社の『Point-E』や、NVIDIA社の『Magic3D』などが代表例ですね。これは、文章で作成したいものを入力すれば、それに対応した3Dモデルを出力してくれるというサービスです。

たとえばオンラインゲームやメタバース内に設置するようなコップや花、家などもすぐに3Dモデルを出力してくれます。3Dを使うデジタルサービスの開発工数を大幅に削減してくれるサービスです。

A氏:動画の自動生成AIも増えています。たとえば動画生成サービスの1つである『Stable Animation SDK』 はテキスト、画像、動画を入力するとアニメーションを作ってくれます。

ただ、動画生成AIについては『自動でこんな動画を作れるなんてすごい』という感動はありますが、現時点では人間が作る動画よりもクオリティが高いとはいえず、違和感がある点も多いです。とはいえ、これもすぐに技術が発展して、人間が作るものよりも良い動画を作るようになるでしょうね。

将来的にはAIが作成したアニメ、YouTube動画、ミュージックビデオなども生まれてくる可能性は高いと思います。

B氏:ここまでの話をまとめると、人間がこれまで作っていたデジタルなモノは、ほぼAIによって作成可能になっていくということになります。よく『AIによってライ ターやプログラマー、イラストレーターの仕事が奪われる』という話がありますが、生成AIの影響範囲は特定の職種に限りません。

何らかのデジタルデータを取り扱っているすべての人がAIの影響を受けるはずです。もちろんAIによって職を奪われるようなマイナス面もありますが、使いこなすことで業務を効率化したり、あらたなビジネスを生み出したりもできるはずです。

▶野村総研と英オックスフォード大学のオズボーン准教授らで行った共同研究によれば、10〜20年後に、日本の労働人口の49%が就いている国内601の職業において、人工知能もしくはロボットで代替可能であると発表されている。

生成AIは確率的に正解であろうものを出力するのであって、すべての物事を100%予測し出力できるわけではない。

——なんだか、AIさえあれば何でもできそうに思えてしまいます。少し俗っぽい質問ですが、株価の予想をAIにやってもらって稼ぐ、なんてこともできたりしますか?

A氏:それはできないでしょうね。そもそもAIは『学習データを元に、確率的に正解っぽい回答・出力をする』 ものです。株価の変動は未来に起きることなので、正解はありません。『株価の変動予測をもっともらしく語る』ことはできても、価格を完璧に予測するようなことはできないのです。

B氏:生成AIは、確率的に正解っぽいものを出力するのであって、正解を出力するものではありません。

おそらく今後、『AIによる自動売買で絶対に稼げる!』などといって投資資金を募るようなサービスも出てくるとは思いますが、『AIがすべての物事を100%予測できるわけではない』ということは理解しておいた方が良いでしょう。正解がないものに関して、AIだからといって正解を導き出せるわけではありません。

——なるほど。では、AIの悪用を懸念するような意見もありますが、具体的にどのような方法で悪用される可能性があるのでしょうか?

A氏:生成AIを使ったディープフェイクはすでに各所で問題になっています。生成AIを使えば、1枚の画像からその人物が喋っているような動画を作成することができます。有名人や政治家が喋っているような動画を作成して嘘の情報を広めるような使い方は、今後何らかの事件につながる可能性があります。

また、画像だけでも偽の災害や戦争被害があったかのようにみた人を錯覚させられるので、悪用されてしまうかもしれません。芸能人の偽画像を作成したり、美人の女性画像を使って人を騙すような行為も今後増えていくでしょうね。

そのほかの問題として、生成AIで出力されるデータについては、人間のような倫理観を持たせることがまだできていないという問題があります。AIは学習データに基いて出力をするだけなので、質問次第では倫理的に問題がある思想や意見を述べることもあるのです。

B氏:悪事なのかどうか、という議論がある部分ですが、特にイラスト業界では画像生成AIの使用に関する 議論が盛り上がっています。これまで自らの腕でイラストを描いていた人たちが、生成AIを活用してイラストを作成し、販売しているような人たちへの不満をあらわにしています。

——著作権の侵害になるのでは?という意見がありますね。

A氏:そうですね。イラストに限らず、生成AIの著作権に関する議論は世界的に広まっています。論点は大きくわけると2つあって、生成AIの学習データに関する著作権と、出力されたデータの著作権です。

たとえばイラストレーターの方は、自分が描いたイラストを学習され て、自分の画風とよく似たイラストを簡単に作成されてしまうと、仕事をすべて奪われてしまう可能性がありますよね。なので、自分のイラストを無断で学習データに利用されたくないですし、学習データとしての利用は著作権侵害である、と考える人がいるのは無理もありません。

ただし、少なくとも日本では著作物を学習データとして利用する場合は法的にも著作権侵害ではない、ということになっています。

B氏:出力されたデータについても、日本では著作権侵害にあたるのかは非常に曖昧です。この点については今後判例などが出ない限り明確にはなりませんが、特定の著作物に非常に類似しているようなものでない限りは、著作権侵害にはあたらないという見方が現在は一般的です。

——つまり、仮にイラストレーターの方の著作物が学習データとして利用されたとしても、出力されたイラストが特定のイラストのほぼコピーのようなものでない限りは、著作権侵害であるとするのは難しいということですね。

A氏:そうですね。ただし、イラスト販売サービスなどが 独自に『AIイラストの作成・販売禁止』などの措置をとることはできるので、現在はそのような形でAIイラストの利用を制限する動きがあります。

B氏:ただし、生成AIに関連する著作権に関しては、現時点で日本は世界トップクラスに寛容です。たとえば英国では、他人の著作物を学習データとして使用する場合は『非営利目的の場合のみOK』ということになっていますが、日本では基本的にノールールで使用可能ということになっています。

A氏:日本は生成AIを利用して何かを作成することに関して非常に寛容なので、クリエイターの方にとってはやや厳しい環境ではありますが、一方で、あらたなビジネスを生み出しやすい環境ともいえますね。

——生成AIを活用したビジネスとしてはどのようなものがありますか?今後誕生しそうなものもぜひ教えてください。

A氏:文章生成AIに関しては、幅広いビジネスで利用され始めていますね。すでにAIが執筆した書籍もいくつか発売されていますし、AIが記事を執筆しているウェブ サイトもあります。また、生成AIを言語学習に使うという動きもあります。AIと英語でチャットすることができて、誤りがあれば正してくれるというサービスも次々とリリースされています。

B氏:文章生成AIとチャットボットを使った教育系のサービスは今後増えていくのではないかと思います。たとえば受験勉強用のチャットボットを作って、利用者の学年や偏差値にあわせて問題を出したり、回答を解説してくれたりするようなサービスがあれば、需要があると思うんですよね。

A氏:何かを教えてくれるだけではなく、単純に話し相手になってくれるようなサービスも生まれるかもしれませんね。生成AIは人間と対話をしているような自然な回答をくれるので、愚痴をいったり相談をしたりするという使い方もできます。

B氏:ChatGPTに性格や設定を指示して、特定のキャラ クターになりきって回答してもらうという遊び方をしている人もすでにいます。たとえば画像生成AIで美人を作って、音声生成AIと組み合わせて会話ができれば、『AI彼女』のようなものも作れそうです。

A氏:画像生成AIに関してはすでにめざとい人たちが画像販売を始めています。AIで生成した女性のイラストを販売したり、写真集を作って販売したりしていて、販売サイトの売り上げ上位になっていますよ。

B氏:あとは今後さらに動画生成AIが発展すれば、YouTubeなどの動画をAIで生成するチャンネルも増えていくでしょうね。3Dモデルとチャットボットなどを組み合わせたAIのVtuberはすでにいくつかリリースされていて、人気を博しています。

A氏:生成AIサービスが盛り上がっているおかげで、これまで特定の技術を持っている人しかできなかったことが、誰でもできるようになっているんですよね。著作権などについて議論は引き続きあるとは思いますが、生成AIを使ってビジネスを起こすチャンスはまさに今という感じです。

——では最後に、生成AIサービスを利用するにあたって知っておくべきポイントがあれば教えてください。

A氏:生成AIは、プロンプト次第で出力されるもののクオリティが変わるという点は知っておいたほうがいいですね。

——プロンプトとは?

A氏:AIに出力する内容を指定するための命令文のことです。たとえばChatGPTに対して『ブロックチェーンとはなんですか?』といったように質問をする文章がプロンプトですね。画像生成AIの場合は『日本の風景』などのように作りたい画像のイメージを伝える文章がプロンプトです。

B氏:ChatGPTに『ブロックチェーンとはなんですか?』と入力するのと、『ブロックチェーンの仕組みを小学生にもわかるように教えて』と入力するのでは、回答に違いがあります。基本的には、より詳細にプロンプトを記述した方が、ユーザーが求めている回答を得やすくなるんです。

A氏:画像生成の場合も同じで、『日本の風景』と入力するよりも、日本のいつ、どこの、どのようなものが写っている風景なのかをプロンプトで入力した方が、イメージ 通りの画像ができあがります。

B氏:生成AIを使えば、自分が作りたいものを簡単に作れると思われがちですが、実はそうではないんですよね。自分が求めているものを言語化して、それをAIに伝える能力が必要なんです。

プロンプトを作って良質な出力をするようにすることを指して、プロンプトエンジニアリングという言葉が生まれるほど、プロンプトは重要です。優れた画像を出力するためのプロンプトを販売する『プロンプトマーケットプレイス』まであるほどですから。

A氏:良いプロンプトを作るために、自分でいろいろと工夫してみるのも良いですが、ほかの人の成功例を学ぶのもおすすめです。たとえば『美人の画像を出力するプロンプト』などはネット上に大量に転がっているので、それを真似て自分なりに必要なキーワードを足したりするのが良いでしょう。

生成AIサービスは、使ってみて出力されるという体験だけでも楽しいので、まだ使ったことがないという方はぜひ触ってみてください。


Profile


◉A氏
AIソフト開発者。生成AIを活用したサービスの開発に従事している。

◉B氏
生成AIを活用したスモールビジネ スを展開。ITライター。


関連記事

AI PROMPT 現代の魔法を使いこなせ

日本を変えるかもしれない業界別効率化AIアプリ

SHARE
  • sns-x-icon
  • sns-facebook-icon
  • sns-line-icon
Side Banner
MAGAZINE
Iolite(アイオライト)Vol.11

Iolite(アイオライト)Vol.11

2025年1月号2024年11月28日発売

Interview Iolite FACE vol.11 SHIFT AI・ 木内翔大、デジライズ・茶圓将裕 PHOTO & INTERVIEW 中村獅童 特集「Unlocking the Future AI時代の到来」「期待と懸念が交差し混沌極まる石破内閣 日本のWeb3.0は今後どうなるのか? 」「暗号資産取引に必要な 税金の知識を学ぶ!基礎知識や今からでも使えるテクニックを解説」 Interview :Bybit ベン・チョウ(Ben Zhou)、マネックスグループ株式会社 ゼロ室 室長/マネックスクリプトバンク 万代惇史・浅見浩志、カオーリア会計事務所代表 現役税理士・藤本剛平 連載 Tech and Future 佐々木俊尚…等

MAGAZINE

Iolite(アイオライト)Vol.11

2025年1月号2024年11月28日発売
Interview Iolite FACE vol.11 SHIFT AI・ 木内翔大、デジライズ・茶圓将裕 PHOTO & INTERVIEW 中村獅童 特集「Unlocking the Future AI時代の到来」「期待と懸念が交差し混沌極まる石破内閣 日本のWeb3.0は今後どうなるのか? 」「暗号資産取引に必要な 税金の知識を学ぶ!基礎知識や今からでも使えるテクニックを解説」 Interview :Bybit ベン・チョウ(Ben Zhou)、マネックスグループ株式会社 ゼロ室 室長/マネックスクリプトバンク 万代惇史・浅見浩志、カオーリア会計事務所代表 現役税理士・藤本剛平 連載 Tech and Future 佐々木俊尚…等