オルタナティブ・ブログ > 経営者が読むNVIDIAのフィジカルAI / ADAS業界日報 by 今泉大輔 >

20年以上断続的にこのブログを書き継いできたインフラコモンズ代表の今泉大輔です。NVIDIAのフィジカルAIの世界が日本の上場企業多数に時価総額増大の事業機会を1つだけではなく複数与えることを確信してこの名前にしました。ネタは無限にあります。何卒よろしくお願い申し上げます。

【技術者向け】いち早いNVIDIA Jetson Thor実装ガイド

»

musubuassets_cinematic_shot_of_Physical_AI_such_as_home_robot_0abc6f73-1f84-4422-b44d-defd649f33f3_2.png

YouTubeで早くもNVIDIA Jetson Thorの実装手順プラスαを解説する人が現れました。彼の説明内容は多くの日本の技術者にとって、「早い情報」として便利だと思います。

英語を抽出して全翻訳かけることもできなくはないですが、それはそちらでもできるでしょうから、技術者にとって意味のある要約を以下に掲げます。NotebookLMで要約させましたが、イマイチな感じなので、その要約をChatGPT 5でブラッシュアップしました。

このYouTubeの方はスイス在住の独立系ロボティクス開発者/研究者で、コンサルテーションにも乗ってくれます。日本の関係企業がアクセスしてオンラインでコンサルしてもらうことも可能です。そんなに高くない方なので早い者勝ちです。

Jetson AGX Thor 実装ガイド

【1】Jetson AGX Thor 開発者キットの構成

  • Jetson AGX Thor開発者キットとして提供され、Jetsonモジュール本体とキャリアボードが含まれます。

  • サイズ(※参考値):

    • モジュール単体:約100mm × 87mm × 15mm

    • 開発者キット全体:約120mm × 110mm × 40mm

  • ロボットやモバイルプラットフォーム、自動運転車などへの直接搭載が想定されています。


【2】冷却と重量設計

  • 大型ヒートシンクとファンは取り外し可能

  • シャーシなど金属筐体に直付けして放熱させることで、冷却効率を上げながら、ロボットの可搬重量を削減。

  • これは、Jetson Thorを軽量ロボットに組み込む際の省スペース・省重量化設計に貢献。


【3】インターフェースと接続性

  • 電源供給:USB-C(最大240W対応)

  • 主なポート(すべて1面に集約):

    • HDMI

    • DisplayPort

    • USB Type-A

    • Ethernet(RJ45)

    • QSFP28(※高速ネットワークまたはセンサーバス接続向け。モーター用ではない)

  • !!QSFP28ポートは主に高速通信用途で、モーター制御用ではなく、センサーとの大容量データ送信に適しています(誤解されやすいポイント)。

  • M.2スロットは1つのみ(拡張性に制約あり)。

  • OrinにあったGPIOやCSI(カメラ用)コネクタは非搭載(Thorの設計思想は「完成型AIコンピュータ」)。


【4】ハードウェア・イン・ザ・ループ(HIL)構成

  • 実機(Jetson Thor)でGR00Tモデルによるリアルタイム推論を実行。

  • カメラデータ・センサーデータはPC上でシミュレーション生成(Isaac Simなど)。

  • JetsonとPCはROS2とローカルWi-Fi経由で接続される。

  • 典型例:容器にナッツを注ぐような動作を、視覚センサ入力からGR00Tが判断して制御。


【5】Jetson Thorの視覚処理・アラート能力

  • GR00Tによる推論処理をJetson上で実行可能。(一種の視覚言語行動モデルVision Language Action Modelとして動作する)

  • ビデオ分析例:

    • 人物検出(安全ベストやヘルメットの有無を認識)

    • 現場アラート検出(例:ヘルメットを着けていない人がハシゴに登っているなど)

  • デモでは3件の違反アラートを正確に検出し、周辺環境まで解析(例:現場に未使用のヘルメットがあるかどうかも検出)。

注:GR00Tを技術的に正確に表現すると以下の通りになる。

GR00T(Generalist Robot 00 Trained model)は、NVIDIAが提唱するマルチモーダルロボット基盤モデルで、以下の要素を統合しています:

  • 視覚(Visual Perception)

  • 言語(Language Understanding)

  • 行動(Action Generation)

  • シミュレーションと実機の往復学習(Sim2Real)

  • トランスフォーマーベースのポリシー生成


【6】Jetson Thor × LLM(大規模言語モデル)実行性能

  • RAMは128GB搭載(LPDDR5x):組込み向けとしては圧倒的。

  • ローカルLLM推論が可能

    • Llama 3 70B(700億パラメータ):動作はするが「非常に重い」。

    • Llama 3 8B(80億パラメータ):はるかに高速で、応答精度も実用的

  • プレゼンターは「ThorでのLLM実行はエッジ用途において革命的」とコメント。

  • Jetson Thorのスペックなら、ビジョン系推論+自然言語応答+動作制御が1チップ内で完結可能。

Comment(0)