世界最大のヒト型ロボット企業になる米Figure社CEOブレット・アドコックのインタビュー2本を要約しました
テスラ社Optimusの発売は今年であるとイーロン・マスクCEOが言っていますが、おそらく部品調達(レアアース磁石を用いたアクチュエータ?)の制約があって伸び伸びになっている様子です。
一方で、以前"Figure AI社"と言っていたヒト型ロボット/ヒューマノイド専門の会社が"Figure"と社名変更して後、YouTube界隈からは怒涛のように情報が流れてきます。(ヒューマノイド関連の情報はYouTubeが第一の情報源だと見ていいでしょう。経済紙誌ばかり見ていると一周前の情報を目にするケースが多くなります)(というのもヒューマノイド関連の公式発表は文字のプレスリリースと並行して動画が出ることがほとんど。ヒューマノイドの動きそのものが差別化点を含む決定的な情報であるからです。文字メディアでは伝えきれない豊富な情報がその動画に詰まっています。そのためヒューマノイド各社の公式発表媒体がYouTubeである...という所に落ち着きます)
比較的最近のFigure社CEOブレッド・アドコック(Brett Adcock)のインタビューYouTube動画がありましたので、私が内容を取捨選択してお届けするよりも、一次情報に近いインタビュー全体の要約をお届けするのが良いと判断し、以下に掲げます。
驚くべき内容を多々含んでいます。日本のメディアでは全く紹介されていないものばかり。
YouTube動画の内容咀嚼では右に出るものはないAIのNotebookLMに1本ずつ読ませて以下の要約を得ました。皆さんもぜひNotebookLMを使って貴重な情報源である欧米YouTube動画から新鮮な情報を得てみて下さい。情報収集効率が飛躍的に向上します。
【Figure社関連投稿】
Figure AIが開業3年で評価額4,000億円のヒューマノイド(人型ロボ)トップ企業になれた理由
BMWで働き始めているヒト型ロボFigure 02:ヒト型ロボの実用化最前線
今すぐ建設現場で役立つヒト型ロボ x BIM:建設業におけるヒト型ロボ活用のアイディア
(Figure社ヒューマノイドをBIMデータが既にある建設現場に投入すると即戦力になるという話)
A Humanoid Robot in Every Home? It's Closer Than You Think w/ Brett Adcock
Figure社とヒューマノイドロボットのビジョン
Figure社は、AGI(汎用人工知能)の究極の展開媒体としてヒューマノイドロボットを開発しています。創業者兼CEOのBrett Adcock氏のビジョンは、AGIがサーバーに閉じ込められるディストピア的な未来を避け、物理世界で行動できる身体を与えることです。この目標は、人間のように物理的なタスクをこなし、様々な応用分野でマルチタスクが可能な単一のプラットフォームを構築することによって達成されると考えられています。
開発の速度とアプローチ
Figure社は、その驚異的な開発速度で知られています。
- コールドスタートからわずか31ヶ月で最初のロボットを出荷しました。
- 会社設立から12ヶ月未満で最初のロボット「Figure 1」が歩行可能になりました。
- 新しいハードウェアプラットフォームを12〜18ヶ月ごとに設計しており、これはハードウェア開発としては非常に速いペースです。彼らは、最初の世代のハードウェアは完璧ではないという考えのもと、迅速な反復開発を重視しています。
- 完全に垂直統合されています。ヒューマノイドロボット向けのサプライチェーンが存在しないため、モーター、アクチュエーター、センサー、バッテリーシステム、構造、そしてファームウェア、組み込みシステム、OS、ミドルウェア、制御、AIといった全てのソフトウェアまで、ゼロからすべてを設計しています。
AIと技術革新
Figure社は、ヒューマノイドロボットの問題をニューラルネットの問題であり、制御の問題ではないと捉えています。
- 彼らは、ロボットが人間のデータを取り込み、人間の行動を模倣できるようにする必要があると主張しています。
- Helix AIという大規模なAIモデルを社内で開発しています。これは、大規模なビジョン・言語・アクションモデルであり、ロボットが訓練で一度も見たことのないアイテムでも認識し、指示されたタスクを完了できる汎化能力を示しています。これは、特に家庭のような多様な環境でロボットが機能するために不可欠なセマンティックグラウンディング(意味的な理解)を実現します。
- Helixは非常に少ないデータ(約500時間)で訓練されており、将来的にデータセットを増やすことでさらに能力が向上すると考えられています。
製品と市場への展開
Figure社は、商業市場と家庭市場の二つの分野に注力しています。
- 商業顧客:
- 最初の商業顧客はBMWで、サウスカロライナ州の工場で車の組立を支援しており、完全に自律的に高精度で動作しています。
- 2番目の顧客は世界最大級の物流会社です。Helix AIを活用することで、新しいユースケースへの導入期間を大幅に短縮(30日未満、将来的には48時間未満)できると期待されています。
- 商業市場はGDPの約半分を占める巨大な市場(50兆〜60兆ドル)であり、労働力不足が深刻な現在、無制限の需要が見込まれています。
- 家庭市場:
- 家庭での導入は、商業用途よりもはるかに困難であると認識されています。これは、安全性の確保(人間を傷つけない、家を燃やさないなど)や、多様な環境でのセマンティックな理解が求められるためです。
- 彼らは、食洗機の荷下ろしや子供のおもちゃの片付けなど、人間がやりたくない日常の家事をロボットがこなす未来を描いています。
- 「iPhoneの瞬間」がヒューマノイドにも起こると予測しており、将来的には家庭に広く普及すると考えています。
Figure 3の展望と価格
- 現在、Figure 2ロボットが商業顧客のもとで稼働していますが、Figure 3のデザインは既に完了しており、今年中に生産に入る予定です。
- Figure 3は、Figure 2と比較して90%安価になり、より小型で軽量化され、センサーも改善されています。特に手、頭、足はニューラルネット向けに設計されており、そのデザインは「次のレベル」に達していると評されています。
- 将来的には、これらのヒューマノイドロボットが2万〜3万ドルの価格帯で提供されると見込んでいます。これは、月額300ドル(1日10ドル、1時間40セント)程度で24時間365日稼働するロボットが利用可能になることを意味し、将来的には一人で複数のロボットを所有する可能性も示唆されています。
- 家庭でのアルファテストは今年中に開始される予定です。
組織と文化
Figure社は、卓越した製品を開発するために世界最高のチームと強固な文化を築くことに注力しています。
- 同社の文化は「アンチシリコンバレー」的と表現されており、週に5〜7日オフィスで非常に熱心に働くことを求められます。
- 創業者はArcher社での成功経験から得た教訓を活かし、チームビルディング、製品開発、エンジニアリングに時間を費やしています。
- チーム全体が「製品を出荷する」という共通の目標に向かって強く連携しており、それが彼らの「ドーパミン」となっています。彼らは、これがヒューマノイドロボットという非常に複雑な問題に取り組む上で不可欠であると信じています。
全体として、Figure社はヒューマノイドロボットの商用化と家庭への普及を目指し、高速なハードウェア開発、革新的なAI(Helix)、そして明確なビジョンと強力なチーム文化を通じて、その「ムーンショット」を現実のものにしようと取り組んでいます。
Bloomberg Live: Figure AI CEO on Building General Purpose Robots
Figure AIのCEOへのインタビューからの情報に基づいて、クエリへの包括的な要約を以下に示します。
Figure AIは、創業からわずか3年で、人間型ロボットの分野で目覚ましい進歩を遂げています。CEOは、人間型ロボットがこれまでで最大のビジネスを構築し、最大の製品ローンチとなると信じています。彼らは基本的に合成人間を構築し、人間のような作業を実行させようとしています。
Figure AIのビジョンと目標:
- CEOは、人間型ロボットは極めて困難なビジネスだが、我々の生涯で最も重要なビジネスの一つになる可能性があると考えています。
- 同社は「SF」に触発され、電気機械とソフトウェアの両面で、人間型ロボットの実現に必要なすべての要素を統合する「適切な時期」であると認識して設立されました。
- Figure AIの究極の目標は、ロボットが大規模に、人間の介入なしに作業を行うことだと述べています。
現在の状況と技術的特徴:
- Figure AIのロボットは、今日すでに商用環境で毎日稼働しており、現在はこれをさらに高いレベルに拡大することを目指しています。
- 同社はFigure 01(以前はFigure 2と呼ばれ、Figure 3も言及されている)を設計しており、通常の人間ができることの大部分を実行できるようにしています。
- ロボットは、自律的な活動においてリモートコントロールや遠隔操作を一切使用していません。遠隔操作はデータ収集やテストにのみ使用されます。
- 最新のデモンストレーションビデオでは、ロボットが単一のニューラルネットワークを使用してカメラフレームからアクションを出力し、人間並みの速度と精度で物流タスク(箱入りとプラスチック包装された荷物の仕分け、バーコードが見えるようにプラスチックを平らにする作業など)を実行している様子が示されています。
- このロボットは、見たことのないイチゴを潰さずに持ち上げて操作するような、高いレベルの制御と器用さも備えています。
- AIモデルに関しては、OpenAIなどの外部モデルに依存せず、社内で全てのAI開発を行っています。これは、彼らが独自で行う方が優れていると判断したためです。彼らはオープンソースの「transformer」バックボーンを使用していますが、データ収集、モデル開発、トレーニング、推論はすべて自社で行っています。
市場とビジネスモデル:
- Figure AIは主に2つの市場をターゲットにしています:
- 商業的な労働力: これは世界最大のビジネスとなり、GDPの半分を占めると見込まれており、世界的な労働人口の減少に対応します。
- 一般家庭: ロボットが洗濯、皿洗い、子供のおもちゃの片付けなど、日常生活の作業を行うことを想定しています。
- 彼らの「主たる指令」は、ハードウェアやモデルを売ることではなく、「作業を売る」ことです。彼らは、音声で指示するだけで、ロボットが自律的に作業を実行できるフルスタックの垂直統合型ソリューションを提供することを目指しています。
製造と拡張性:
- Figure AIは、「bot.Q」と呼ばれる独自の製造プロセスと施設を開発しており、1ラインあたり年間12,000台のロボットを製造できる設置能力を持っています。
- CEOは、4年で10万台のロボットを出荷するという目標を掲げており、これを可能にするのは自動車製造よりもはるかに容易な消費者向け電子機器の製造プロセスを採用しているためだと考えています。
商業的パートナーシップ:
- BMWは公表されている顧客であり、ボディショップで板金を移動させる作業を行っています。このパートナーシップは、Figure AIがロボットを日常的にクライアントサイトで安全かつ効率的に稼働させる方法を学ぶ上で非常に重要であるとされています。
- 2番目の顧客は物流分野にあり、初期の展開を開始しています。ブルームバーグは、この顧客がUPSであると報じています。物流作業は、荷物のサイズや形状が毎回異なるため、ニューラルネットワークによる高度な汎化が必要とされる、コーディングでは解決できない課題を伴います。
データと学習:
- 同社はGPUの問題を抱えておらず、むしろデータの問題とロボットの問題を抱えていると述べています。つまり、現場でデータを生成するロボットがより多く必要であるということです。
- ロボットが市場でデータを収集し、互いに学習を共有することで、集団的なフリート全体でパフォーマンスが向上します。
- これにより、同社は最も安価で最もスマートなロボットを提供できるようになり、これは「勝者総取り」市場になる可能性があると信じています。
財政と展望:
- Figure AIは潤沢な資金を持っており、現在のバランスシートには、他の人間型ロボットグループがこれまでに調達した総額よりも多くの現金がある可能性が高いとされています。これにより、大規模な製造や最高の人材の確保に必要な資金は十分にあるとのことです。
- CEOは、自社のロボットが「ハードウェアが機能し、信頼性が高まっている」段階にあり、「AIを搭載して人間のようなことを行い、人間から学び、時間とともに向上できる」段階にあると考えています。
- Figure 3ロボットは、Figure 2よりも90%以上安いと述べています。
- 同社は、テスラのOptimusなどの競合他社にあまり時間を費やしていないが、Figure AIは「AIと人間型AIロボットの両方で、おそらく世界で最も優れた実世界での進歩」を示していると主張しています。