オルタナティブ・ブログ > 経営者が読むNVIDIAのフィジカルAI / ADAS業界日報 by 今泉大輔 >

20年以上断続的にこのブログを書き継いできたインフラコモンズ代表の今泉大輔です。NVIDIAのフィジカルAIの世界が日本の上場企業多数に時価総額増大の事業機会を1つだけではなく複数与えることを確信してこの名前にしました。ネタは無限にあります。何卒よろしくお願い申し上げます。

テスラのOptimusや中国Unitreeなど、ヒト型ロボット/ヒューマノイドの技術の基本中の基本を大解説!

»

Alternative2025Jul01a.png

最近、経済新聞や雑誌などでも取り上げられる機会が増えてきたヒト型ロボット/ヒューマノイド。なんとなくわかっているようで、基本的な技術はどのようになっているのか?ロボット工学を学んだことがない方々のために、ヒューマノイドの技術の基本中の基本をスーパー卓越したロボット工学の知識を持つChatGPT氏に解説してもらいました。

従来のロボットとヒューマノイド(ヒト型ロボット)の違い

「ロボット」と一口にいっても様々な形態がある中で、ヒューマノイドは人間と同様に二足で歩ける点が特徴です。産業用ロボットは通常ベースが固定されているが、ヒューマノイドは常に足裏を床面に接触させて自立する必要がありますjstage.jst.go.jp

つまり、産業用アームロボットは据え置きで腕だけを動かせば良いが、ヒューマノイドは移動しながら体全体のバランスを取らなければなりません。一方、人型であるメリットとして、人間が設計した環境(ドア、高さ1段の階段、狭い廊下など)のまま使える点が挙げられます。こうした違いを意識しつつ、次節以降ではヒューマノイドの主要な技術要素を順に見ていきます。

基本技術要素の解説

カメラ・センサーの役割と種類

ヒューマノイドには、人間の「目」や「耳」に相当する各種センサーが搭載されています。jstage.jst.go.jp。視覚用にはRGBカメラが使われ、物体認識や環境把握に用いられます。

最近のモデルでは、ToF(Time-of-Flight)カメラやステレオ・デプス(Depth)カメラで距離情報も取得し、足元や周囲の3D形状を高精度にセンシングするケースが増えていますtechplay.jp

また、平衡を取るためにはIMU(慣性計測装置:ジャイロ、加速度センサー)で体の傾きや動きを検知し、足裏に内蔵された力覚センサー(ロードセル)で荷重分布を測ります。音声操作や会話のためのマイクも搭載されることが多いです。

さらにLiDAR(レーザー測距)や赤外線センサーで周辺地図を作成し、動的に移動経路を計算する機体も出てきています。これら多様なセンサーを組み合わせることで、人間の目や耳のように環境情報を取得し、安全な歩行や作業動作を実現しています。

アクチュエーター(モーターなど)と動作設計

ヒューマノイドの各関節には主に電動のアクチュエーター(モーター)が配置されます。toragi.cqpub.co.jp。従来型ではブラシ付きのDCサーボモーターやACサーボモーターが使われ、それぞれポテンショメータやエンコーダで角度制御を行う設計が一般的です。

例えば近藤科学のKHR-1はブラシ付きDCサーボ+ポテンショメータで構成され、ソニーのQRIOはACサーボ+エンコーダで高精度制御していました。最新のモデルでは、ブラシレスDCモーターにギヤ(減速装置)を直結した小型高性能アクチュエーターが主流になっています。これにより高トルク・低バックラッシュを実現し、安全に手や腕を動かせるようになっています。

軽量かつ高速応答なコアレスDCモーターは、テスラのOptimusでは指先関節に採用されており、繊細な把持操作を可能にしていますfoxtechrobotics.com。肩や手首など高トルクを要する関節にはフレームレストルクモーター(慣性を極力抑えた構造)が使われ、Optimusでは肩部に14個のフレームレスモーターが配置されています。

一方、Boston DynamicsのAtlasのようにダイナミックな動作が求められる機体では、油圧アクチュエーターが採用されており、大きな荷重を発生できる代わりに複雑なメンテナンスが必要となるfoxtechrobotics.com。(今泉注:Boston Dynamicsの最近の機種では電動アクチュエーターに全面転換した。リンク先調査報告書を参照)これら多種多様なアクチュエーターを各関節に組み合わせて動力伝達し、歩行・走行やアーム操作などを行っています。

Unitree社G1が実現している様々な動きの実例がわかる同社ウェブサイト。Unitree G1/H1では胴体と四肢に合計23〜43個の駆動関節を持ち、各関節にモーターが配置されているgigazine.net。図中のようにロボット全身にわたってアクチュエーターが組み込まれ、迅速かつ広い可動域を実現しています。

AI/処理装置(エッジコンピュータ含む)の重要性

ヒューマノイドが環境を認識し判断するには多くの計算リソースが必要で、画像認識や音声処理、運動計画のためにAI処理装置が不可欠となります。最近ではGPUや専用AIチップを搭載したエッジコンピュータをオンボードに搭載し、画像認識モデルや制御モデル、言語モデルなどを同時に動かす設計が主流です。

NVIDIAはヒューマノイド用にコンパクトなAIコンピュータ「Jetson Thor」を開発し、これに制御用ポリシーやビジョンモデルを展開することでロボットの"脳"を構成するアプローチを提唱していますblogs.nvidia.co.jp。同様にテスラは同社EVの自動運転AIコンピュータをOptimusに流用し、8台のカメラ映像をニューラルネットワークで解析して周囲認識・行動計画を実現していますnote.com

リアルタイム性が重要なため、多くの機体ではクラウドではなくオンボード(ヒューマノイドの内部)で処理する「エッジAI」を採用し、NVIDIA JetsonやIntel Movidiusなどの組込みAIチップで推論を行っていますultralytics.com blogs.nvidia.co.jp

電源・バッテリー設計の制約

ヒューマノイドはバッテリー駆動であるため、可動時間と重量・サイズとのバランスが重要となります。

より大容量バッテリーを積めば連続稼働時間は延びます、その分だけ重量が増えて姿勢制御や駆動負荷が増大し、アクチュエーターにも高出力が求められます。したがって、モーター駆動系は効率を最優先に設計されており、電源電圧は48V前後が一般的で、高電力時には10kW近くを消費する場合もありますti.com

実用的には数kWhクラスのバッテリーパックを積み、数時間の動作を目指す機体が多いです。例えば、Tesla Optimusは2.3kWhのバッテリーで約4時間の連続稼働が可能とされていますnote.com。Agility Roboticsの「Digit」は1.0kWhで通常稼働3時間(重作業時1.5時間)を確保し、タスクに最適化すれば8時間駆動できると報告されていますnote.com。しかしいずれも限界があり、バッテリー交換式や自動充電ステーションの活用などで運用性を補う設計が求められます。

構造設計の難しさ(人型ゆえの課題)

ヒューマノイドの根本的な難点は二足歩行の不安定さにあります。人間もロボットも重心(Center of Mass)が高く支持基底面(足裏の接地面積)が狭いため、重心が少しでも基底面外に出ると容易に転倒してしまいますnote.com

歩行・走行では片足支持や時には両足が浮いた状態となり、常時高度なバランス制御を行う必要があります。さらに、ヒューマノイドではアームや手首、指先まで含めて多自由度の関節を持つ構造が必要です。

このため、全身のフレームには軽量化と剛性確保の両立が求められ、関節数が増えるほど配線・配管・冷却系統も複雑化します。設計段階ではケーブルの取り回しや各関節の干渉、熱対策など物理的制約にも注意が必要になります。

ソフトウェア制御と学習

ヒューマノイドの制御には従来の位置フィードバック制御(PID制御や逆運動学)に加え、機械学習技術の活用が進んでいます。

近年は「模倣学習」と「強化学習」を組み合わせた制御系が主流となっており、人間の動きを真似て基本的な歩行や把持を学習し、その後シミュレーション環境で強化学習により高度な制御を習得させる手法が用いられているsompo-ri.co.jp

具体的には、現実の動作データから歩行モデルを学び、デジタルツインの仮想空間で数百万回の試行を重ねてバランスや運動効率を向上させます。

リアルタイム推論には前述のエッジAIが欠かせず、高性能AIチップで実装することで、限られた計算リソースでも柔軟な動作制御が可能になっていますblogs.nvidia.co.jp

各要素の相互依存性

ヒューマノイドでは各技術要素が互いに影響し合います。例えば、重いバッテリーを積むとロボット全体が重くなるため、それを支える構造体やより大出力のアクチュエーター設計が必要になりますti.com

逆に大トルクのモーターを多数搭載すると消費電力が増え、電源系や冷却機構の強化が求められます。

センサーやカメラを増設すると計算量や通信量が増加し、AI処理装置の性能と電力設計にも影響が及びます。設計時には「重量・消費電力・計算性能・コスト」など複数の要素のトレードオフを考慮する必要があるのです。

具体例として、以下のような相互依存があります。

  • 重いバッテリー → 構造設計やアクチュエーター出力に影響(重量増で強度・パワー負荷が増大)ti.com

  • 多数の関節・モーター → 配線・配管スペースが増え、通信方式やモータ制御アルゴリズムが複雑化する。

  • 高性能AIチップ搭載 → 冷却・電源設計に追加コストがかかる。逆に低消費型デバイスを選ぶと処理能力に制約が生じる。

このように、ヒューマノイド設計では全体最適の視点が欠かせません。

まとめ

本稿ではヒューマノイドを支える技術要素について解説しました。カメラ・センサー、アクチュエーター、AI/処理装置、バッテリー、構造、ソフトウェアといった基本要素を理解しておけば、各社製品の比較がしやすくなります。

例えば、可動自由度や重量、稼働時間、コストなどの仕様を見比べる際に、何を優先した設計かが明確になるからですnote.com。こうした基礎知識を踏まえて製品の強み・弱みを判断すれば、自社の用途に最適なロボットを選定しやすくなります。

Comment(0)