オルタナティブ・ブログ > 経営者が読むNVIDIAのフィジカルAI / ADAS業界日報 by 今泉大輔 >

20年以上断続的にこのブログを書き継いできたインフラコモンズ代表の今泉大輔です。NVIDIAのフィジカルAIの世界が日本の上場企業多数に時価総額増大の事業機会を1つだけではなく複数与えることを確信してこの名前にしました。ネタは無限にあります。何卒よろしくお願い申し上げます。

ソフトバンクPepperもNVIDIA Jetson Thorを搭載してローラー脚に改造すれば最新のフィジカルAIになる!

»

NVIDIAの8月に出たばかりの超高性能AIエッジコンピュータ(クラウド接続不要の小型で軽いAIコンピュータ)のポテンシャルは日本のビジネス界には「まったく」と言っていいぐらい知られていません。以下はJetson Thorが発表された直後に書いた「ロボット産業は自動車業界超え」とまで言い切っている弊ブログです。

NVIDIA Jetson Thor:自律ロボットの"学習"の大部分が不要になる「オンボード・リーゾニング」。ロボット産業は自動車業界超え(2025/8/27)

さて。このシリーズでは、現存するメーカーの製品や技術をJetson Thorと組み合わせると、どんな圧倒的性能を持つフィジカルAIが実現するか?を、一種の思考実験として展開しています。今回はソフトバンクが取り組んだロボットPepperを取り上げます。

Pepperは残念ながら生産中止になったようですが、いえいえまだまだ、あのロボット筐体は使い出があります。Pepperに「脳」としてJetson Thorを取り付け、Pepperの脚を最近のロボット開発ではブームになっているローラー脚として改造すると、以下のようなフィジカルAIに生まれ変わります。

今回も技術的な正確性を記すために執筆は最新のChatGPT 5.1にやらせます。有料版でないと解像度が高くなりませんのでご注意を。

ソフトバンクのPepperもオフィス適応フィジカルAIエージェントへと進化できる

ソフトバンクのPepperは、2014年の登場以来、日本の"受付ロボット"の象徴として広く認知されてきました。
しかし近年、技術の進化とともに「Pepperは時代が早すぎた」という評価も再び聞かれはじめています。

そして今――NVIDIA Jetson Thorが登場したことで、Pepperは"もう一度、生まれ変わる"条件をすべて手に入れました。

(今泉注:Jetson Thorのわかりやすい解説投稿はこちらエンジニア向けの実装ガイドはこちら。)

結論からいえば、Pepperは "対話できる知能ロボット"から、"自律行動する現場エージェント"へと進化 します。

その中心にあるのが以下の3点です。

  • (1) オープンソースのLLM × Jetson Thor による"オンボード自然対話"

  • (2) 多様なセンサー融合(カメラ・音・環境・距離)による状況理解

  • (3) ローラー脚ユニットによる静音・高速・安全な自律移動

以下で具体的に見ていきます。

1. オープンLLM搭載で「受付係」から「社内フィジカルAIスタッフ」へ

これまでのPepperはクラウド処理が必須で、応答にも限界がありました。
しかしJetson Thorが加わることで、Pepperは次の能力を獲得します。

オンボード(クラウドなし)でGPTクラスのLLMを動かす

Jetson Thorの800 TOPS級の推論性能は、
「クラウド不要の自然対話」を類人並みの速度で実現します。

→ つまり、Pepperが現場で、ネットなしでも、自然に喋る時代が来るのです。

多言語対応:来訪者の母語で会話できる

日本語・英語・中国語・フランス語・スペイン語──
すべてPepperの"脳内"で処理可能。

「来訪目的は?誰に会いに来ましたか?今日のアポイントを確認しますね」

"What brings you here today? Who are you visiting? Let me check your appointment."

"请问您今天来访的目的是什么?您要见谁?我来为您确认一下预约。"

"Quel est le motif de votre visite ? Qui venez-vous voir ? Je vais vérifier votre rendez-vous."

"¿Cuál es el motivo de su visita? ¿Con quién tiene una cita? Permítame verificar su reserva."

こうした会話が、まるで人間の受付係のように自然になります。

2. Pepper最大の弱点だった"状況理解"が劇的に改善する

Pepperは「対話はできるが、状況がよくわからない」という弱点がありました。
Jetson Thorを搭載すると、ここが根底から変わります。

深度・距離・顔向き・視線・人数をリアルタイム解析

Jetson Thorのマルチモーダル推論により、

  • 目の前に何人いるのか

  • その人はどこを見ているのか

  • 荷物は持っているか

  • 落とし物はないか

  • 体調が悪そうか

すべて"現場で"理解できます。

センサーフュージョンでPepperが"周囲を読める"

Pepper の胸部や頭部に搭載可能なセンサーは以下の通り:

  • ToF距離センサー(人との距離認識)

  • 環境センサー(温度・CO₂・VOC)

  • マイクアレイ(360度音声)

  • 超広角カメラ(空間・人流解析)

Jetson ThorのHoloscanがそれらを統合し、
Pepperは"空間の全体像"を常に保持します。

→ これが「人に近づきすぎない」「人を先に通す」「混雑時に道を譲る」を可能にします。

3. "ローラー脚"に換装すればPepperが本当に動き出す

Pepperが「動かないロボット」だったのは、二足歩行の制約でした。
そこでPepperをローラーベースの台座に載せ換える案を提案します。(今泉注:現在のヒューマノイド開発の傾向として、あえて二足歩行をやめて、スムーズなフロアをローラーで移動するタイプの"脚"で割り切る例が出始めている。オフィス、ホテルなど床面がなめらかな場所での稼働ならこれで十分。エレベーターに乗って各階移動もできる。最新の事例はこちら。)

● 利点

  • 床を傷つけない静音性

  • オフィス・商業施設でのスムーズな巡回

  • 転倒しない高い安定性

  • 10〜15km/h程度の高速移動も可能

特に物流センター・病院・空港では、ローラー脚Pepperは抜群の実用性があります。

4. 新生Pepperが実現する"現場AIエージェント"の具体像

(A)企業受付の完全自動化

来客者を認識し、

  • 会社名

  • 訪問先部署

  • アポイント有無

  • 会議室の空き状況

を即時判断し、自動的に担当者を呼び出します。

(B)社内案内ロボットとしての自律行動

Pepperは来客を先導し、

  • 会議室まで案内

  • フロアを横断

  • エレベーター乗り継ぎ支援

など、人に近い動作を行えます。

(C)インバウンド客への"文化通訳AI"

Jetson Thor で LLAVA系VLA(Vision-Language-Action)を稼働させれば、

  • 日本の文化的行動

  • ビジネスマナー

  • 書類手続き

  • 支払い手順

外国人の母語でPepperが説明 できます。

(D)オフィスセーフティ・見守りAI

Pepperは巡回しながら、

  • 温湿度

  • CO₂濃度

  • 人の体調異常

  • 倒れている人

  • 不審物

をリアルタイム解析します。

5. Pepperは"令和の職場OS"になる

Jetson Thor × オープンLLM × センサーフュージョン × ローラー脚
これらが組み合わさると、Pepperは次のように変わります。

「話すロボット」から
「考え・動き・状況判断までできる
  "現場AIエージェント"」へ。

Pepperは日本発ロボティクスの象徴です。
そのPepperが Jetson Thor で復活し、"第2の人生"を歩む姿は、
ソフトバンクだけでなく、日本のAIロボティクス産業全体に大きな示唆を与えるでしょう。


【セミナー告知】SSK 新社会システム総合研究所 主催

NVIDIAが示したフィジカルAIの衝撃

〜日本製造業が掴むべき市場機会と事業化の道筋〜

[日時] 2025年12月4日(木)14:00〜15:30 

(オンラインセミナーであり、当日から数日経ってアーカイブ配信された後の2週間はいつでも視聴可能。詳細はこちら

[講義内容]

「フィジカルAI」という言葉は2025年1月のコンシューマエレクトロニクスショー(ラスベガスのCES2025)におけるNVIDIA CEOジェンセン・フアンの基調講演をきっかけに世の中に広まり始めました。このセミナーでは時価総額でも世界有数の企業になったNVIDIAのCEOによるフィジカルAIの定義を基礎として、先ごろ発売されたロボット用エッジコンピュータJetson Thorによって初めて明確になった「日本の製造業が開発販売できるフィジカルAI」の全体像をご説明します。自律的なロボット、ドローン、農業機械、建設機械、検査保全ロボットなど、具体的な応用形は様々あり、日本の製造業にとって新しい時代が来ることを予感させます。

【参加申込はこちら/セミナー提供形態等の詳細はこちら】

1.イントロダクション:AIの進化の三段階

 ・知覚AI → 生成AI → フィジカルAI

 ・ジェンセン・フアンのフィジカルAIの定義は「知覚し、推論し、計画し、行動するAI」

  (AI which Perceive, Reason, Plan, and Act)

2.技術解説:ジェンセン・フアンの定義を技術的に翻訳すると...

 ・センサー&センサーフュージョン

 ・Vision-Language-Action (VLA) モデル

 ・リアルタイム推論とオンボード処理

 ・簡素化される学習プロセス:事前学習+現場適応

3.日本の製造業が開発に使えるツール:Jetson ThorとNVIDIAスタック

 ・Jetson Thorの特徴(オフライン/オンボードで動作、高度なリーゾニング、センサーフュージョンとの接続、

  ChatGPT的なLLMを搭載し人間の言葉による指示ができる等)

 ・Omniverse、Isaac SimなどNVIDIAスタックとの連携により高速開発ができる

4.ユースケース

 ・ヒト型ロボット//四足歩行ロボット

 ・自律走行ドローン

 ・農業機械(自律トラクター、収穫ロボット)

 ・物流倉庫ロボット

 ・建設機械(自律重機、搬送ロボット)

 ・外観検査ロボット

 ・サービスロボット

5.まとめと質疑

 ・「日本企業が参入すべき領域」

 ・「部品メーカーのビジネス機会」

 ・Q&A

Comment(0)