Google I/O 2024で発表されたAI関連サービスの幅広い強化で競争激化。
2000年代後半から徐々に広まり始めた米ビッグテックを呼称するGAFAは、GAFAM、FANG、「MATANA(マタナ)」へと形を変えて、2024年にはMeta社がV字回復をしたこともあり、あらたに「M7(マグニフィセント・セブン)」という名称に行き着いた。
米国500社の株価を元に算出されるS&P500(Standard&Poor’s 500 Stock Index)の内、その時折にビッグテックと称される企業の時価総額の合計はS&P500全体の時価総額の約3割を占め、M7とそれ以外を指数にした場合、約5倍もの差が生まれるようだ。
なかでもあらたにM7と称されるようになったのが、テスラと「NVIDIA(エヌビディア)」。テスラは自動車のEV化が着実に進む過程でEVブランドを確立し、順調に販売台数を伸ばしている経緯がある。
NVIDIAが手がけるGPUは、主に画像やビデオ処理のための計算処理を高速化するために設計されたプロセッサであったが、近年では、機械学習やディープラーニングといったAI分野でも中心的な役割を果たすようになった。これらの計算には大量のデータを高速に処理する能力が求められ、GPUの並列処理能力が非常に有効に機能するという。
AI領域の概況——2024 2024年のAI領域は、技術の進化と実用化がさらに進み、多くの分野で活用事例と効率化に貢献している。特に生成AI技術の発展は目覚ましく、テキスト、画像、動画などのコンテンツ生成が高度化し、個人や企業のコンテンツ作成能力が大幅に向上。マーケティングやエンターテインメント、教育などの分野で広く利用されるようになっている。
また、医療分野への応用も急速に進む。診断支援や治療計画の策定、患者データの分析など、多岐にわたる医療業務でAIは活用され、医療の効率化と精度向上に寄与している。
ビジネス領域においてもいわずもがな、業務効率化のための自動化ツールとして広く採用されている。カスタマーサービスにおけるチャットボットの活用、データ分析ツール、予測モデリングなどで、企業の生産性向上に寄与。国内ではGMOインターネットグループが生成AIの活用を進めた結果、約96,000時間、600人/月に相当する業務時間を創出したことを発表した。このことからも世界中でAIの活用は浸透しつつあることがわかるだろう。
こうしたなか、AI倫理と規制の議論も世界各国で活発化している。たとえば、プライバシー保護やバイアス排除、透明性の確保などが重要な課題だ。各国政府や国際機関がAIの規制の枠組みを整備し、責任あるAIの開発と利用を推進できるように環境を整えているところだ。
OpenAIの何が人々を惹きつけるのか? 人工知能に関連するキーワードを「Google Trends」で調べてみると、2014年ごろから検索件数が上昇している。2015年、米OpenAIはイーロン・マスク、サム・アルトマンらによって、非営利組織として設立される。
AIに限っていえば2022年の夏頃から検索件数が急速に上昇。ChatGPTが誕生したのも2022年の後半である。絵に描いたようにトレンドを掴んだプロジェクトだ。
OpenAIは人工知能研究機関であり、AI技術を全人類のために安全に利用できるようにすることを使命とした非営利組織。OpenAIの主なビジョンは、オープンアクセスと透明性の原則を守りつつ、友好的なAIの開発を通じて人類全体の生活を向上させること。
ChatGPTシリーズが同社のプロダクトの最たる例として認知されているが、ほかにもGPT-3の派生モデルでコード生成に特化した「OpenAI Codex」や画像とテキストを関連付けることで視覚データから情報を抽出するAI「Clip」、AI画像生成モデル「DALL-E 2」、AI動画生成サービス「Sora by OpenAI」の開発も手がけている。
先述の通り、2014年頃からAIに関連するキーワードは徐々に注目を浴びてきた。しかしながら、2022年後半にChatGPTが登場するのと同時期に、勢いを増してAIへの注目度はあがったように思える。
それほど市場にとってChatGPTの革新的なサービスとOpenAI、ひいてはサム・アルトマンという存在が魅力的だったということだろう。
ChatGPTはなんといっても優れた自然言語処理能力と応用範囲の広さに最大の強みがある。人工知能でありながら人間に近い対話形式の対応が可能で、ニュアンスや全体の文脈を理解しているかのような応答には目を見張るものがある。加えて、コンテンツ制作やコーディング、言語翻訳に至るまでツールの組み合わせ次第で数多の活用事例が現在も生み出され続けている。
OpenAIとサムを取り巻く環境と物語も人々を惹きつける要素ではないだろうか。2023年11月、OpenAI取締役の一部が、取締役会とのコミュニケーションにおいてアルトマン氏が率直さを欠き、取締役会の責任遂行を妨げているとして、サムと共同創業者で社長のグレッグ・ブロックマンらに解雇が伝えられた。
追放されたかのようにみえた直後、主要株主であるMicrosoft社は、サムとグレッグをAI部門の強化のために迎え入れた。これに加えて、OpenAI社の優秀なエンジニアたちは猛抗議し、最終的にはOpenAI社に戻ることになったのだ。
約5日の間で起こった目まぐるしい変化のなかで、Microsoft社のCEOサティア・ナデラ氏の采配とサムのカリスマ性が垣間みえた。映画の題材として扱われるような物語を生むカリスマ性も人々を惹きつける魅力かもしれない。
▶︎ChatGPT-4oとGoogle I/O 2024の比較
AI領域の今後の展望 技術の進化と共にAIの活用事例はますます多岐にわたるものとなっている。なんといっても生成AI技術の進歩は、クリエイティブな分野の大変革の要素として機能するだろう。音楽、アート、文学などでの創作活動はさらに効率化され、高度なクリエイティブが量産される未来は近い。
また、自然言語処理の精度向上により、より自然で高度な人間とAIのコミュニケーションが実現し、カスタマーサービスや教育分野での応用が進むだろう。実際、GPT-4oの発表とともに公開された動画のなかでは、スペイン語と英語の同時通訳をしているところが映像に収められている。
AI領域の目まぐるしい発展はAI活用における倫理や規制の重要性がより一層増すことも意味する。AIの普及に伴い、プライバシー保護や公平性、透明性の確保が求められ、世界各国で足並みを揃えた法整備や国際的なルール作りが求められる。
これにより、AI技術の信頼性と社会的受容性が高まり、持続可能な発展が促進されるだろう。
知っておきたいAIツール10選 1.ChatGPT 対話型AIを使用してユーザーとコミュニケーションを取る多目的チャットボット
●ChatGPT-4oによって豊かな表現で人間らしい対話が可能に
●写真や図表などの画像の理解力が向上
2.Canva グラフィックデザインの要素やコンテンツ作成を支援
●デザイン提案のほか、画像のぼやけや色味の調整をAIが自動で行う
●AI駆動のコピーライティングツールでさまざまな用途にあわせた内容を提供
3.Jasper AI ユーザーが効率的に文章コンテンツを生成できるよう支援
●ユーザーが提供するプロンプトに基づいて、高品質なテキストを生成
●ユーザーのブランドやトーンにあわせてカスタマイズされたテキストを生成することが可能
4.Midjourne テキストから高度な画像生成が可能なサービス
●リアルな画像から抽象的なアートまで多様なビジュアルを作成可能
●最新のディープラーニング技術を活用し、高解像度な画像を生成
5.Voice In 高精度の音声入力ができるChrome拡張機能
●SNS等、Webブラウザ上のほとんどのテキストフィールドで使用可能
●英語を含む多くの言語にも対応
6.Vrew 動画編集や字幕生成を効率化するためのAIツール
●日本語を含む複数の言語に対応して動画内の音声を自動的にテキストに変換
●自動生成された字幕のタイミングを手動で微調整する機能がある
7.Fireflies.ai 会議の録音、文字起こし、分析を行うAIツール
●Zoom、Google Meetなどのビデオ会議プラットフォームと連携し会議を自動録音
●録音した会議から重要なポイントを抽出し、自動的にノートや要約を作成
8.GitHub Copilot プログラマーがタイピングする際にコードのスニペットを提案するツール
●開発者が入力中のコードに基づいて、次に書くべきコードを予測し自動的に補完
●潜在的なエラーやバグが含まれている場合、検出して修正提案
9.Synthesia(シンセシア) テキストを入力するだけで、リアルなアバターがそのテキストを話す動画を生成
●50以上の言語に対応、多数のアバターから任意のアバターを選択して動画生成が可能
●テキスト追加、画像やグラフィックの挿入など編集機能が充実
10.HeyGen(ヘイジェン) AI技術を利用した革新的なビデオ生成プラットフォーム
●テキストをプロフェッショナルなビデオに数分で変換可能
●40以上の言語対応でグローバルなコンテンツ制作が可能
関連記事 量子コンピュータは人類が創り上げた神器なのか?
ブロックチェーンの活用により拓かれる金融領域のあらたな形
バーチャルワールドと現実世界が溶け合う未来が近付きつつある