ソフトバンクPepperもNVIDIA Jetson Thorを搭載してローラー脚に改造すれば最新のフィジカルAIになる!
NVIDIAの8月に出たばかりの超高性能AIエッジコンピュータ(クラウド接続不要の小型で軽いAIコンピュータ)のポテンシャルは日本のビジネス界には「まったく」と言っていいぐらい知られていません。以下はJetson Thorが発表された直後に書いた「ロボット産業は自動車業界超え」とまで言い切っている弊ブログです。
NVIDIA Jetson Thor:自律ロボットの"学習"の大部分が不要になる「オンボード・リーゾニング」。ロボット産業は自動車業界超え(2025/8/27)
さて。このシリーズでは、現存するメーカーの製品や技術をJetson Thorと組み合わせると、どんな圧倒的性能を持つフィジカルAIが実現するか?を、一種の思考実験として展開しています。今回はソフトバンクが取り組んだロボットPepperを取り上げます。
Pepperは残念ながら生産中止になったようですが、いえいえまだまだ、あのロボット筐体は使い出があります。Pepperに「脳」としてJetson Thorを取り付け、Pepperの脚を最近のロボット開発ではブームになっているローラー脚として改造すると、以下のようなフィジカルAIに生まれ変わります。
今回も技術的な正確性を記すために執筆は最新のChatGPT 5.1にやらせます。有料版でないと解像度が高くなりませんのでご注意を。
ソフトバンクのPepperもオフィス適応フィジカルAIエージェントへと進化できる
ソフトバンクのPepperは、2014年の登場以来、日本の"受付ロボット"の象徴として広く認知されてきました。
しかし近年、技術の進化とともに「Pepperは時代が早すぎた」という評価も再び聞かれはじめています。
そして今――NVIDIA Jetson Thorが登場したことで、Pepperは"もう一度、生まれ変わる"条件をすべて手に入れました。
(今泉注:Jetson Thorのわかりやすい解説投稿はこちら。エンジニア向けの実装ガイドはこちら。)
結論からいえば、Pepperは "対話できる知能ロボット"から、"自律行動する現場エージェント"へと進化 します。
その中心にあるのが以下の3点です。
-
(1) オープンソースのLLM × Jetson Thor による"オンボード自然対話"
-
(2) 多様なセンサー融合(カメラ・音・環境・距離)による状況理解
-
(3) ローラー脚ユニットによる静音・高速・安全な自律移動
以下で具体的に見ていきます。
1. オープンLLM搭載で「受付係」から「社内フィジカルAIスタッフ」へ
これまでのPepperはクラウド処理が必須で、応答にも限界がありました。
しかしJetson Thorが加わることで、Pepperは次の能力を獲得します。
● オンボード(クラウドなし)でGPTクラスのLLMを動かす
Jetson Thorの800 TOPS級の推論性能は、
「クラウド不要の自然対話」を類人並みの速度で実現します。
→ つまり、Pepperが現場で、ネットなしでも、自然に喋る時代が来るのです。
● 多言語対応:来訪者の母語で会話できる
日本語・英語・中国語・フランス語・スペイン語──
すべてPepperの"脳内"で処理可能。
「来訪目的は?誰に会いに来ましたか?今日のアポイントを確認しますね」
"What brings you here today? Who are you visiting? Let me check your appointment."
"请问您今天来访的目的是什么?您要见谁?我来为您确认一下预约。"
"Quel est le motif de votre visite ? Qui venez-vous voir ? Je vais vérifier votre rendez-vous."
"¿Cuál es el motivo de su visita? ¿Con quién tiene una cita? Permítame verificar su reserva."
こうした会話が、まるで人間の受付係のように自然になります。
2. Pepper最大の弱点だった"状況理解"が劇的に改善する
Pepperは「対話はできるが、状況がよくわからない」という弱点がありました。
Jetson Thorを搭載すると、ここが根底から変わります。
● 深度・距離・顔向き・視線・人数をリアルタイム解析
Jetson Thorのマルチモーダル推論により、
-
目の前に何人いるのか
-
その人はどこを見ているのか
-
荷物は持っているか
-
落とし物はないか
-
体調が悪そうか
すべて"現場で"理解できます。
● センサーフュージョンでPepperが"周囲を読める"
Pepper の胸部や頭部に搭載可能なセンサーは以下の通り:
-
ToF距離センサー(人との距離認識)
-
環境センサー(温度・CO₂・VOC)
-
マイクアレイ(360度音声)
-
超広角カメラ(空間・人流解析)
Jetson ThorのHoloscanがそれらを統合し、
Pepperは"空間の全体像"を常に保持します。
→ これが「人に近づきすぎない」「人を先に通す」「混雑時に道を譲る」を可能にします。
3. "ローラー脚"に換装すればPepperが本当に動き出す
Pepperが「動かないロボット」だったのは、二足歩行の制約でした。
そこでPepperをローラーベースの台座に載せ換える案を提案します。(今泉注:現在のヒューマノイド開発の傾向として、あえて二足歩行をやめて、スムーズなフロアをローラーで移動するタイプの"脚"で割り切る例が出始めている。オフィス、ホテルなど床面がなめらかな場所での稼働ならこれで十分。エレベーターに乗って各階移動もできる。最新の事例はこちら。)
● 利点
-
床を傷つけない静音性
-
オフィス・商業施設でのスムーズな巡回
-
転倒しない高い安定性
-
10〜15km/h程度の高速移動も可能
特に物流センター・病院・空港では、ローラー脚Pepperは抜群の実用性があります。
4. 新生Pepperが実現する"現場AIエージェント"の具体像
(A)企業受付の完全自動化
来客者を認識し、
-
会社名
-
訪問先部署
-
アポイント有無
-
会議室の空き状況
を即時判断し、自動的に担当者を呼び出します。
(B)社内案内ロボットとしての自律行動
Pepperは来客を先導し、
-
会議室まで案内
-
フロアを横断
-
エレベーター乗り継ぎ支援
など、人に近い動作を行えます。
(C)インバウンド客への"文化通訳AI"
Jetson Thor で LLAVA系VLA(Vision-Language-Action)を稼働させれば、
-
日本の文化的行動
-
ビジネスマナー
-
書類手続き
-
支払い手順
を 外国人の母語でPepperが説明 できます。
(D)オフィスセーフティ・見守りAI
Pepperは巡回しながら、
-
温湿度
-
CO₂濃度
-
人の体調異常
-
倒れている人
-
不審物
をリアルタイム解析します。
5. Pepperは"令和の職場OS"になる
Jetson Thor × オープンLLM × センサーフュージョン × ローラー脚
これらが組み合わさると、Pepperは次のように変わります。
「話すロボット」から
「考え・動き・状況判断までできる
"現場AIエージェント"」へ。
Pepperは日本発ロボティクスの象徴です。
そのPepperが Jetson Thor で復活し、"第2の人生"を歩む姿は、
ソフトバンクだけでなく、日本のAIロボティクス産業全体に大きな示唆を与えるでしょう。
【セミナー告知】SSK 新社会システム総合研究所 主催
NVIDIAが示したフィジカルAIの衝撃
〜日本製造業が掴むべき市場機会と事業化の道筋〜
[日時] 2025年12月4日(木)14:00〜15:30
(オンラインセミナーであり、当日から数日経ってアーカイブ配信された後の2週間はいつでも視聴可能。詳細はこちら)
[講義内容]
「フィジカルAI」という言葉は2025年1月のコンシューマエレクトロニクスショー(ラスベガスのCES2025)におけるNVIDIA CEOジェンセン・フアンの基調講演をきっかけに世の中に広まり始めました。このセミナーでは時価総額でも世界有数の企業になったNVIDIAのCEOによるフィジカルAIの定義を基礎として、先ごろ発売されたロボット用エッジコンピュータJetson Thorによって初めて明確になった「日本の製造業が開発販売できるフィジカルAI」の全体像をご説明します。自律的なロボット、ドローン、農業機械、建設機械、検査保全ロボットなど、具体的な応用形は様々あり、日本の製造業にとって新しい時代が来ることを予感させます。
1.イントロダクション:AIの進化の三段階
・知覚AI → 生成AI → フィジカルAI
・ジェンセン・フアンのフィジカルAIの定義は「知覚し、推論し、計画し、行動するAI」
(AI which Perceive, Reason, Plan, and Act)
2.技術解説:ジェンセン・フアンの定義を技術的に翻訳すると...
・センサー&センサーフュージョン
・Vision-Language-Action (VLA) モデル
・リアルタイム推論とオンボード処理
・簡素化される学習プロセス:事前学習+現場適応
3.日本の製造業が開発に使えるツール:Jetson ThorとNVIDIAスタック
・Jetson Thorの特徴(オフライン/オンボードで動作、高度なリーゾニング、センサーフュージョンとの接続、
ChatGPT的なLLMを搭載し人間の言葉による指示ができる等)
・Omniverse、Isaac SimなどNVIDIAスタックとの連携により高速開発ができる
4.ユースケース
・ヒト型ロボット//四足歩行ロボット
・自律走行ドローン
・農業機械(自律トラクター、収穫ロボット)
・物流倉庫ロボット
・建設機械(自律重機、搬送ロボット)
・外観検査ロボット
・サービスロボット
5.まとめと質疑
・「日本企業が参入すべき領域」
・「部品メーカーのビジネス機会」
・Q&A