応答速度0.85秒の執念。ノイズ環境を克服したAI「HITO」が、ハードウェアに依存しないソフトウェア展開を選ぶ理由

2026/07/01 18:34 (2026/07/01 19:59 更新)
Iolite 編集部
文:Noriaki Yagi
SHARE
  • sns-x-icon
  • sns-facebook-icon
  • sns-line-icon
応答速度0.85秒の執念。ノイズ環境を克服したAI「HITO」が、ハードウェアに依存しないソフトウェア展開を選ぶ理由

「HITO」開発の背景と、フィジカル空間のDX

HITO Demo picture1

——Webサイトや社内システムのデジタル化が進む⼀⽅で、実店舗や受付といった「物理空間のDX」は、無機質なタッチパネル端末が置かれる程度にとどまっており、まだまだ⼤きな壁があると感じています。「HITO(ヒト)」は、この物理空間におけるデジタル化の停滞をどのように突破し、次世代の社会インフラとしてどのような役割を担っていくとお考えでしょうか?

守屋貴行(以下、守屋):世の中全体でDXが進んでいますが、やはり「フィジカル空間のDX」こそが最終的な課題だと考えています。私たちはこれまでバーチャルヒューマンを作り続けてきましたが、それをAIと融合させることで「いかに本物の人間に近づけるか」を実現したいという強い思いがあります。

私たちがオンライン上だけでなく、フィジカル空間での企業課題の解決に注力する理由は、大きくわけて3つあります。「インバウンド対応」「人口減少(人手不足)」「接客品質の均一化」です。

たとえば、担当者によって案内内容が変わってしまうといった属人的な課題を解消できます。何より、現在の日本において深刻な問題となっているインバウンド対応や人手不足に対して、フィジカル空間のDXは不可欠な解決策になると捉えています。

——Awwの強みと社会課題がマッチしたタイミングでリリースされたのですね。プレスリリースを出されてからの反響はいかがですか?

守屋:実は、今回のようなパッケージ化されたサービスを出す前から、自動車メーカーや住宅メーカーなどで、対話型のソリューションによる課題解決の実績は複数ありました。

ただ、これまでは個別開発の案件だったため、より多くの企業様にサービスとしてご提供できるよう、急ピッチで自社開発のSaaSモデルとして作り上げました。そうしてリリースに至ったのが、今回の「HITO」です。

幸いにも早速、さまざまな業種からの問い合わせをいただいており、本導入も進み始めています。また、どういう使い方をしたらいいかなど迷っている企業にはPoCなどでリーズナブルなテスト提供も実施しているので、まずは気になる方は是非ご連絡ください。

Aww Moriya picture1

圧倒的な「低遅延」へのこだわり

——̶̶発話から最短0.85秒という超低遅延応答を、フル3DCGのリアルタイム描画と同時に実現するためのハードルは何でしたか?

守屋:スピードはとにかく重要視しました。対話体験において、レスポンスが遅いことはユーザーにとって1番のストレスになります。最初はUIやUXの工夫で体感的な遅延を解決しようと試行錯誤したのですが、やはり根本的な「速度」そのものに徹底的にこだわりました。

裏側では複数のAIモデルを組み合わせており、ASR(音声認識)、LLM(大規模言語モデル)、TTS(音声合成)など、すべてのプロセスにおいて0.1秒単位で時間を削る工夫が必要です。他社のサービスを研究しても、速度をあげようとすると精度がさがるというトレードオフの課題があり、ここで「何を取捨選択するか」が非常に大きなハードルでした。

——具体的にはどのような検証をされたのでしょうか。

守屋:たとえば、ドキュメント上は精度が良いとされていても、実際の現場で使えるかどうかは別問題です。そのため、ASR(音声認識)だけでも120以上、TTS(音声合成)でも数十のサービスを実際にテストしました。速度が速くても精度が低い、あるいはその逆のケースもあるなかで、私たちが求める対話体験にフィットするかを何度も検証を重ねています。

なかでも特に難易度が高かったのが、フィジカル空間特有の「ノイズ環境下での処理」です。周囲の雑音や他の人の話し声が混ざる環境において、ユーザーがどこで話し終わったかを認識する「発話終了判定」をどう設定するかが非常に重要でした。そこについては完全独自のデータで学習させることで、ノイズ環境下でも素早く、かつ的確に反応できるように工夫しています。

ハードウェアに依存しないソフトウェア展開の狙い

——専⽤ハードウェアでの「実在感」に特化した競合も存在しますが、HITOはあえてハードウェアに依存しないソフトウェア展開を主軸に置かれています。今後、スマートフォン、デジタルサイネージ、さらにはAR/VR空間など、マルチデバイスへ展開していく上での技術的な強みや狙いを教えてください。

守屋:専用デバイスからアプローチした方が強みを出せる面もありますが、私たちの最大の強みは「バーチャルヒューマンそのもの」にあります。

現状、日本はまだ少ないですが、海外ではすでに街中がデジタルサイネージであふれています。LEDディスプレイの低価格化も進んでおり、日本でもこれから一気に普及していくはずです。そうなれば、ディスプレイというインフラが世の中にすでに整備されている状態になります。

そのため、独自のハードウェア開発による在庫リスクやコストをおさえ、まずは既存のデバイスを活用して導入のハードルをさげるアプローチをとりました。

ただ、物理空間に設置する以上、ハードウェアは建築やインテリアと密接にかかわってきます。単に「モニターが無骨に置かれている」といった不格好な状態は避けたいので、額縁のように壁掛けにするなど、空間にいかに溶け込ませるかという「見せ方の工夫」は社内でも非常に重要視しています。ゆくゆくは、ハードウェアを含めたトータルパッケージでの展開も視野に入れています。

imma's picture1
©上岡拓也「Imma Land.」— DIESEL「imma天」より、現在Aww officeにて展示

経年劣化しないIP投資とROIの最大化

——企業がHITOを「ブランドの顔」として採⽤(フルオーダー)した場合、完全な統制が可能で、かつ経年劣化しないIPという特性は、企業の⻑期的なブランド投資(ROI)をどう変⾰するとお考えでしょうか?

守屋:私たちは単にシステムを導入していただくだけでなく、AIを活用したクリエイティブ制作やコンサルティングの段階からプロジェクトに参画することが多くあります。

そのなかで最近よく感じるのは、短期的なKPIを追い求めるあまり、本質的なブランド価値を見失っているケースが少なくないということです。目先の数字だけを達成しようとした結果、かえってLTV(顧客生涯価値)やROIが低下してしまう現象が起きています。

そこで活きてくるのが、「長く育てていけるIPになる」というバーチャルヒューマンならではの強みです。

初期段階では「人件費削減」や「インバウンド対応」といった、目の前の明確な課題を解決するために導入されます。特にフィジカル空間では、多言語で24時間対応でき、シフトや体調に左右されず、一定の品質で受付・案内・接客を担えること自体が、運用負荷の軽減や機会損失の削減という直接的なROIにつながります。

しかし、そこでキャラクターに対する顧客の反応がよければ、次第に広告モデルとして起用したり、採用面接の一次対応を任せたりと活躍の場を広げ、最終的には「企業の顔(IP)」へと成長していきます。さらに、来訪者との会話を通じて、どのような質問が多いのか、何に関心を持っているのかといったフィジカル空間ならではの顧客理解も深まっていきます。

このように、短期的には業務効率化や接客品質の安定化、長期的にはブランド形成や顧客理解の資産化によって、高いROIを実現できるポテンシャルがあると企業様にはお伝えしています。

キャラクターのLLM構築とプライバシー保護

——̶̶企業のブランドや理念を体現する「Character-LLM(性格やユーモアの⾃律⽣成)」をゼロから設計する際、最もこだわっているプロセスを教えてください。

守屋:実は、キャラクターごとのユニークな性格付けよりも、まずは「クライアントが求める回答を、いかに正確に再現できるか」という点に最も注力しています。

大量のペルソナを用意して徹底的に評価を行い、あらゆるシチュエーションで最適な回答ができるよう調整を重ねています。もちろん、話し方や声色といった最低限のキャラクターライズは行いますが、大前提として「言語コミュニケーションとして破綻なく成立させること」を最優先にしています。

——閉域網での稼働が可能である点は、特に⾦融・医療機関への導⼊において可能性が広がると考えます。今後、「ソブリンAI(⾃律型データ基盤)」の構築が進むなか、データのプライバシー保護やローカルAI基盤との連携についてどのような戦略を描いていますか?

守屋:金融機関など、セキュリティ要件が極めて厳しい領域での活用も見据え、すでに対応を進めています。

現在、AIの基盤モデルは急速に基盤モデルのコモディティ化が進んでおり、必ずしもクラウドに接続せずとも、ローカル環境で十分に精度の高い返答が可能な時代になりつつあります。特にフィジカル空間での音声対話には個人情報が含まれるケースが多いため、プライバシーが保護されたセキュアな状態でデータ活用ができる仕組みを構築することが、今後のさらなるサービス改善において非常に重要だと考えています。

ご指摘にある通り金融・医療、そして行政などの空間でもAI導入が実現できると考えています。それも社内での活用だけではなく、お客様に対してのサービス提供のなかでAIが利用され、そのデータがプライバシーが保護された状態で活用が始まると、データドリブンのサービス提供や改善が可能になると考えています。

Aww Moriya picture2

マルチモーダル化とブロックチェーンの融合

——視覚情報の統合(マルチモーダル化)が今後の進化のカギとされています。HITOが来訪者の「表情」や「⾝なり」をカメラで瞬時に読み取り、⽂脈に合わせたホスピタリティを⾃律的に提供できるようになった時、どのような発展に期待しますか?

守屋:現在もカメラを用いた人物の認識などは行っていますが、表情分析まではまだ本格導入していません。それよりも今は、優秀な営業担当者が持つ「こう話せば人が動きやすい」といった会話の機微や戦略を、システムに落とし込むことを優先しています。

もちろん感情認識などの研究も進めていきますが、まずは会話を通じた自然な誘導や、課題解決の精度を徹底的に高めることの方が重要だと考えているからです。

——HITOのような⾃律型AIエージェントがインフルエンサーとして経済圏を築くようになった際、ブロックチェーンを活⽤した「AIキャラクターのアイデンティティ(IP)証明」や、トークンを通じた「ファンコミュニティとの価値共創(DAO)」といったブロックチェーン技術との統合は視野に⼊っていますか?

守屋:ゆくゆくの進化のゴールとして、それは非常に意味のあることだと思っています。AIがエージェントとしてフロントのタスクをこなし、その裏側の基盤としてブロックチェーンが機能していくという世界観です。

ただ、大前提として多くのブロックチェーンプロジェクトは、クリプト発で生まれていますが、本来的には実業で収益のある「事業の課題解決」が先行すべきだとも考えています。まずは明確な問題解決のためにAI(HITO)が活用され、その上で、例えばキャラクターの権利管理や来訪証明といった領域でブロックチェーンが健全に使われていく。

日本のIPをブロックチェーン上で管理しながら、カスタマーサポートだけでない展開も考えられます。そうした順序で社会実装が発展していくのが理想ですね。

AI時代に人間がはたすべき役割

——⾼度なテクノロジーの結晶に「HITO(ヒト)」という名前を冠した点に強いメッセージ性を感じます。マルチモーダル化が進み、AIがホスピタリティまでも⾃律的に提供するようになった未来において、⽣⾝の「⼈間」がはたすべき役割は何になるとお考えですか?

守屋:私は「人間の仕事はもっと減らした方がいい」と考えています。AIが人間の仕事を「奪う」のではなく、「減らす」。そして、人間にはもう少し人間らしい生活をしてほしいという思いがあります。

極端な話、現時点でも「これは必ずしも人間がやらなくてもいい」という業務は社会にたくさん存在します。そうした業務をAIに任せることで、高度な法人営業やクリエイティビティの求められる企画など、「人間にしか生み出せない価値」に時間と人材を割くべきです。

AIがもたらす最大の変化は、「人間に時間を与えてくれること」にあります。その空いた時間を使って、深く考えることや人間らしい営みにフォーカスしていく。それこそが、これからの社会のあるべき姿だと思います。

Aww Moriya picture3

インプットと感性の源泉

——守屋さんのお話は非常にアート的でブランディングの視点が鋭いと感じます。その感性を高めるために心がけていることはありますか?

守屋:無意識に好きなことを仕事にしているだけかもしれませんが、日常的にYouTubeやSNSなどを通じて、毎日すさまじい量の情報には触れるようにしています。

また、20代の頃の圧倒的な経験量が今の自分のベースになっています。24、25歳で数億円規模の案件を任され、パニックになりながらも必死に乗り越えた経験があり、そこからはどんなに規模の大きな仕事でも冷静に回せるようになりました。

今は情報が簡単に手に入る時代ですが、昔は自分が欲しい情報にたどり着くために、深夜にDVDを何本も観るような「無駄な時間」が必要でした。でも、そうした非効率で泥臭いインプットの経験が、結果的に今の感性に活きているのだと思います。

あとは、年齢を重ねて自分の価値観だけで語るようになるのが嫌なので、今の若者が「何を見て、何を面白いと感じているのか」を、SNSの投稿ひとつからでも常にキャッチアップするように意識しています。


【本件に関するお問い合わせ先】
株式会社Aww
広報担当:Sara Giusto
Mail:info@aww.tokyo

Aww Moriya picture4

画像提供:Aww Inc.
写真:Shogo Kurobe


Profile

◉守屋 貴行  |  Takayuki Moriya
Aww Inc. CEO

20代に起業し、プロデューサーとして、企業の広告立案、ブランディング、コンサル、CM制作や、海外アーティストのMVなどを数々手がける。

Aww.incを創業し、アジア初のバーチャルヒューマン「imma」を生み出す。世界8000以上のメディアに掲載され、パラリンピック閉会式、万博開会式の司会を務めるまでに成長。当人は万博キャラクターミャクミャクの選考も担当。


関連記事

「COACH(コーチ)」×バーチャルヒューマン「imma」―原宿で始まるAIスタイリング体験

バーチャルモデル「imma」とは何者なのか 彼女が語る現代の 「あたらしいリアル」とは—

SHARE
  • sns-x-icon
  • sns-facebook-icon
  • sns-line-icon
Side Banner
Side Banner
MAGAZINE
Iolite(アイオライト)Vol.20

Iolite(アイオライト)Vol.20

2026年7月号2026年05月29日発売

Interview Fireblocks CEO 兼共同創業者 マイケル・シャウロフ、RippleX SVP マーカス・インファンガー PHOTO & INTERVIEW 米倉涼子 特集「『決済の未来』ゲートウェイの先へ」「タブーなき技術革新 デュアルユースの衝撃。」「BMIが拡張する人類の未来―「第6の感覚」は脳直結デバイスから―」 [対談連載]The NISHI Talk:Crypto Conversations 「DeFiの「真の分散性」と暗号資産業界の課題」 、仮想NISHI×内田善彦 連載 Tech and Future 佐々木俊尚…等

MAGAZINE

Iolite(アイオライト)Vol.20

2026年7月号2026年05月29日発売
Interview Fireblocks CEO 兼共同創業者 マイケル・シャウロフ、RippleX SVP マーカス・インファンガー PHOTO & INTERVIEW 米倉涼子 特集「『決済の未来』ゲートウェイの先へ」「タブーなき技術革新 デュアルユースの衝撃。」「BMIが拡張する人類の未来―「第6の感覚」は脳直結デバイスから―」 [対談連載]The NISHI Talk:Crypto Conversations 「DeFiの「真の分散性」と暗号資産業界の課題」 、仮想NISHI×内田善彦 連載 Tech and Future 佐々木俊尚…等