オルタナティブ・ブログ > 経営者が読むNVIDIAのフィジカルAI / ADAS業界日報 by 今泉大輔 >

20年以上断続的にこのブログを書き継いできたインフラコモンズ代表の今泉大輔です。NVIDIAのフィジカルAIの世界が日本の上場企業多数に時価総額増大の事業機会を1つだけではなく複数与えることを確信してこの名前にしました。ネタは無限にあります。何卒よろしくお願い申し上げます。

設立3年で2億8,000万ドルを調達した中国X Square Robotの発展ヒストリーを分析してわかったこと

»

Alternative2025Sep12a.png

先日掲げたX Square Robotが設立から3年で2億8,000万ドルを調達するという、米国ロボット会社にもないような超高速の発展がどのようにして可能になったのか?AIで調査しました。

同社は深圳にあり、深圳のスタートアップによく見られるパターンである「1時間で移動できる範疇にある部品会社で最適部品を見定め、1日でPoCを作り、あとはガンガン改善を続ける」式の開発で速度を得ていた...小職はそのように考えたのですが、全然違っていました。もっと知的なアプローチをしていました。一言で言えば「AI駆動型ロボット開発」に集中していました。結果として早期にプロトタイプを得ることができ、フィジカルなハードウェアも具現化でき、デモとしてお披露目できる所まで来た...と言うことのようです。

3年間のヒストリーを分析してわかったことは、「Embodied AI/基盤モデルをまず構築する」「モデルの要件をハードウェア設計に反映する」「実世界での操作・物理挙動の検証を早期に行う」というサイクルを非常に迅速に回してきていると言うことです。

別な言い方をすると、仮想空間でモデルを高速に反復(イテレーション)し、十分な性能が見えた段階でハード設計と並行開発するというプロセスを踏んでいます。

詳細は以下をお読み下さい。


以下、X Square Robot の "About" ページ情報をベースに、「どのようにしてソフトウェア(モデル)中心の開発体制を築いてきたか」「車輪付きヒューマノイドを具現化するに至った過程」を整理し、日本のロボティクス/ロボットAI関係者にとって参考になりそうな知見を抜き出してまとめます。

X Square Robot の発展史:モデル主導のロボティクスを具現化する道

はじめに

X Square Robot(2023年12月設立)は、「Embodied Intelligence(身体を伴う知能)」をキーワードに、リアルワールドデータ/汎用の基盤モデル(foundation model)を中心に据えてロボットハードウェアと連携する開発を進めてきています。その歩みから、モデル主導/ハードウェアとの統合法の最新トレンド、可能性と課題が見えてきます。

発展のフェーズと特徴

以下、設立から現在までのおおよそのステージと、その特徴・技術的マイルストーンを時系列+論点で整理します。

ステージ 期間 主な活動内容・成果 モデル中心開発との関係性・特徴
設立直後 2023年12月 「General Embodied Foundation Model」を掲げてスタート。リアルワールドデータを主要データソースとすることを明言。 モデルが中心。まずソフトウェア基盤(感覚・認知・操作命令系など)を定義・設計。ロボット筐体はその成果を応用・具現化する対象として位置づけられている。
コアチームの確立 設立〜設立後数ヶ月 Attention 機構(Transformer)の先駆者、国際的ロボティクス研究ラボの科学者、1000億パラメータ級の中国の基盤モデルの設計者、ロボットハード/システム設計経験者らをコアメンバーに確保。 モデル開発に必要な AI アルゴリズム・大規模モデル設計・ハードとの協調設計の人材を揃えることにより、モデル主導でハードウェア実装までを視野に入れた底力を持つ組織構造を手に入れている。
モデルの定義と公開 設立後半年〜1年 基盤モデル(foundation model)、マルチモーダル前学習(vision, language, action / manipulation)、そしてモデルの OSS 版 ("WALL-OSS") の構築・公開。 仮想環境だけでなく実世界データを重視。モデルをオープンにし、コミュニティ/研究者/産業界との共有・協業を見込むことで、モデルの改善・応用範囲を広げる戦略。これにより、ハードウェアを持たない/小規模なチームでもモデル利用ができる土壌を作る。
ハードウェアへの結びつけ モデル開発と並行/その後 Quanta シリーズ(例:Quanta X2)、ArtiXon Hand といった物理ロボット製品を設計・発表。これらはモデル(感覚・操作指令系)を具体的な筐体に具現化したもの。 モデルが先、ハードウェアが追従する構造。ソフトでどこまでできるかをまず設計し、それを支えるハード(手指、車輪など)がそれを実現できるよう設計されている。このため、手が20 DOF、高精度など操作部のスペックもモデルの要件に応じて設計されている。
資金/組織の拡充と地理的展開 設立から1年〜1年半 複数拠点(北京・上海・深圳)での研究・ハードウェア設計・システム設計体制の構築。主要投資家の獲得。 モデルの大規模化・運用性を担保するためには資金力と組織力が必要であり、それを速いペースで確立してきている。これはモデル中心/研究開発とプロトタイピングを高速で回せる体制を持つことを意味する。

ヒューマノイド(車輪型ロボット)を作るに至った論点

モデル中心設計から「車輪付きヒューマノイド(Wheeled Humanoid)」のプロダクトを具現化するまでのキー要因を抽出します。

  1. モデル要求によるハードの仕様決定

    • モデルが「視覚 → 言語 → 操作命令 → 動作」の全リンクを持つことを目指しているため、手指の自由度、操作精度、可搬重量/力の要件などがモデル側の性能目標として逆にハード部設計に影響を与えている。

    • たとえば、Quanta 2 の 20 DOF の手、操作精度、可搬 6kg といった仕様は、操作タスク(manipulation)のモデル要求に応えるもの。

  2. 機動性と運用性のトレードオフ

    • 歩行型ヒューマノイドはバランス制御・エネルギー消費・耐久性など複雑性が高い。一方で、車輪型ベース(wheeled base)を採用することで安定性、コスト、速度、メンテナンス性における優位性がある。

    • Quanta 2 のように車輪+折畳める構造を持たせる設計は、運搬・屋内走行・収納や移動の容易性を考慮したものであり、モデル中心の設計目標の "実用性/汎用性" を具現化する妥協点(合理的選択)と言える。

  3. 前学習モデル(multimodal pretraining)を基盤として試作を高速化

    • モデルを仮想世界/シミュレーション/写真・センサー実データで訓練し、それをハードに転用するパイプラインの確立。

    • OSS 公開などで他者の知見を取り込むことも含めて、実際のハード設計/試作サイクルを早めている。

  4. 人材構成とトランスフォーマー的手法の採用

    • コアチームに attention 機構の研究者や大規模基盤モデル設計者がいることから、モデル設計能力が高く、ソフトウェア/アルゴリズム主導で始め、ハードへのフィードバックループを短くできる。

    • ハードウェア畑出身だけでなく、AI/大規模モデル出身の人材を取り込んだことが、モデル主導の文化を定着させる上で重要。

  5. オープンソース ("WALL-OSS") 戦略の活用

    • モデルやコードを一部オープンにすることで、外部研究者・開発者からの知見・フィードバックを取り込める。

    • これがモデル改善/動作実証(操作ミス・異環境対応など)の加速に繋がる。

  6. 迅速なプロトタイプ-ハードウェア製品投入

    • ArtiXon Hand のような操作系デバイス、Quanta シリーズのサンプル/プロトタイプを早期に発表することで、モデルがハードでどこまで通用するかを可視化・検証する。

    • これはモデル中心で仮説設計を行いつつ、現実の"物性・物理・運動制御"等のギャップを早期に発見・修正するための戦略。

日本のロボティクス関係者への示唆と教訓

X Square の歩みから、日本でのロボット/ロボットAI開発に応用できる知見・戦略を以下に整理します。

  1. モデル先行+ハード追随型設計
    モデル(特に知覚・言語・操作の統合モデル)を先に決め、それを実現できるハードウェアを追いかける設計アプローチが有効。仕様を明確化することでプロトタイプ設計や評価がしやすくなる。

  2. マルチモーダル・前学習モデルの活用
    視覚、音声、言語、触覚など複数モダリティを使った前学習を採用し、「環境認識 → 対話/命令理解 → 操作」の流れをエンドツーエンドで持たせることが、汎用性を担保する鍵。

  3. OSS や公開を通じた外部知見の取り込み
    モデル・ツールやコードをオープンにすることで、国内外の研究機関やスタートアップとの協業、改善サイクルの高速化を期待できる。日本の大学・企業も共同研究やオープンモデルの利活用を考えるべき。

  4. ハード/機械設計の妥協点を見極める
    車輪型 vs 歩行型、自由度の数、可搬重量など、リアルな用途をアウトラインして、必要十分な仕様に集約すること。X Square は車輪型・折畳可など、運用性を重視した設計を選んでいる。

  5. 人材構成と組織設計の重要性
    AI モデル設計者、操作制御/ロボットハード経験者、システム統合者をバランス良く揃えること。特に attention/transformer/大規模モデルの経験者を早期に入れておくことで、モデルの基盤設計力が高まる。

  6. 実世界データ収集と検証のループを重視
    シミュレーションだけでなく、実際の操作・触覚フィードバック・現場環境でのテストを早期に取り入れ、不具合や設計の齟齬を早く発見して修正する。

  7. 資金調達とスケールの見通し
    モデルの開発・大量データの学習・ハードウェア試作には資金と設備がかかる。X Square は設立から短期間で資金調達を重ね、複数拠点で開発体制を整えている。日本でも、このような先行投資とスピードを持つ取り組みを検討したい。

終わりに:X Square の「モデル → ハード」の道は日本にも活かせる

X Square Robot の歴史を見ると、「Embodied AI/基盤モデルをまず構築する」「モデルの要件をハードウェア設計に反映する」「実世界での操作・物理挙動の検証を早期に行う」というサイクルを非常に迅速に回してきていることが最大の特徴です。

日本のロボティクス界でも、これらの要素を戦略的に取り入れることで、AI×ロボットの実用化を加速させるヒントが多く得られると思います。

Comment(0)