ホームITAI技術の最終地点 フィジカルAI

IT Insight

AI技術の最終地点 フィジカルAI

レンテックインサイト編集部

AI技術の最終地点 フィジカルAI

 「次のAIの波はフィジカルAI」――、これはエヌビディアのジェンスン・フアンCEOが2025年4月に首相官邸を表敬訪問した際の発言であり、会談の大きなテーマとなったものです。そして、ジェンスン・フアンCEOは2025年5月に台湾で開催された「COMPUTEX 2025」の開幕式において、「フィジカルAIの次の段階は汎用ロボティクス」とも語っています。こうした発言は、AIサーバー/データセンターを中心にAIコンピューティングの領域で圧倒的な存在感を放つエヌビディアにおいて、フィジカルAIやロボティクスが重要な分野となっていることを示しています。

 近年のテクノロジー市場はAIを中心に動きが活発化しています。特に2022年11月にChatGPTがローンチされて以降、生成AIの市場が一気に拡大し、直近ではエージェントAI(目標達成のために最適な手段を自律的に選択してユーザーに代わってタスクを遂行するAI)の取り組みが増えています。そして、その次のフェーズと目されているのがフィジカルAIです。

 フィジカルAIは、物理的な現実世界を認識・理解して複雑な行動にも対応するAIを指します。つまりはAIがサイバー空間から飛び出して物理的な環境と直接相互作用し、自律的に判断・行動するシステムになることを意味します。しかし、フィジカルAIの社会実装には、デジタル世界のAIと現実世界をつなぐ橋渡し役が必要になります。その橋渡し役を担うと見込まれているのが、自動運転車なども含めたロボティクス技術であり、フィジカルAIはロボティクス技術と切っても切れない関係にあります。そして、そうした未来を見据え、エヌビディアはフィジカルAIやロボティクス分野に関連した技術やサービスをすでに複数展開しています。

 具体的には、①シミュレーション、②AIサーバー/データセンターなどAIインフラ向けのコンピューティング、③エッジデバイスに搭載される高性能コンピューティングの三つが挙げられます。「シミュレーションを行い、その中で生成されたデータをAIインフラを用いて学習し、そこで構築されたモデルをエヌビディアのAI半導体などが搭載されたロボットなどのエッジデバイスに実装する。さらに、ロボットなどで取得したデータもAIインフラに戻してモデルの性能をさらに高める」といったスキームであり、こうした仕組みの構築にエヌビディアは力を入れています。

 ロボットを含む高性能なエッジデバイスに搭載されるコンピューティングシステムとしては、エヌビディアの「Jetson」(ジェットソン)シリーズが多く活用されています。高性能なGPUを搭載し、AI推論などをエッジデバイス上で実行できる組み込みコンピューティングプラットフォームであり、現在の主力モデル「Jetson Orin」(ジェットソン オーリン)では、20~275TOPSの製品をラインアップしています。そして、Jetsonシリーズの次世代モデルが「Jetson Thor」(ジェットソン ソー)であり、エヌビディア先端アーキテクチャー「Blackwell」を用いたGPUなどを搭載し、2000TFLOPSという驚異のパフォーマンスを発揮します。

シミュレーション技術でAIを高性能化

 現在、産業用ロボットなどにおいて作業を覚えさせるための手法としては、作業内容を教示したあと、動作を再生させる「ティーチングプレイバック」によって、実際に実機を動かしながら調整する手法が一般的ですが、性能を向上させるために多くのデータを必要するAI搭載型ロボットなどの場合、ロボットを実際に動かして性能を高めることは、時間もコストも要します。また、テスト回数が増えると、予期せぬ挙動を起こす可能性も高まり、事故や故障のリスクも高まります。そこで、開発期間やコストを低減する手法が必須となり、その一つとして現実環境では難しいデータ収集を仮想空間上で効率的に実施するシミュレーション技術の活用が非常に重要となります。

 そのためエヌビディアでも近年、シミュレーション関連製品の開発を積極的に進めており、現在その主力製品となっているのが「Omniverse」(オムニバース)です。エヌビディアの高性能GPU技術などを活用することで、物理的に正確でフォトリアルな仮想環境(デジタルツイン)を生成できる技術で、生産ラインの動作テストなど物理演算が重要なケースで特に高い効果を発揮します。離れた場所にいる複数のユーザーが同じ仮想空間にアクセスし、3Dオブジェクトやシーンをリアルタイムで編集・確認することもできます。Omniverseは、Pixarが開発した「USD」(Universal Scene Description)という技術をベースとしており、異なるソフトウエアやツール間で3Dデータを双方向でやり取りできる高い相互運用性も備えます。

 そして、Omniverseを基盤としたロボティクスシミュレーション技術が「Isaac Sim」(アイザック シム)です。Isaac Simは、Omniverseで構築したデジタルツインにロボットおよび周辺機器のデータを取り込んで、操作シミュレーションやナビゲーションシミュレーションを行うことができ、ロボットの導入にかかる費用や工数の削減に貢献。照明の当たり方などをランダムに変え、さまざまなシチュエーションに対応できるような学習も行えます。

エヌビディアはフィジカルAIの基盤もすでに展開

 エヌビディアは直近でもこうした技術をさらに発展・拡大させており、その中で注目を集めているのがフィジカルAIシステムを開発するためのプラットフォーム「Cosmos」(コスモス)です。Cosmosには、「Predict」(プレディクト)、「Reason」(リーズン)、「Transfer」(トランスファー)という三つの機能が含まれています。そのうちPredictは、フィジカルAIが、未来の状況や動きを予測するためのモデルです。テキスト、画像、動画などの入力(プロンプト)に基づいて、仮想的な世界の状況を生成できることに加え、入力された動画や画像から、〝未来の世界の様子〟(数秒後のクルマの動き、ロボットの次の動作など)を予測して生成できることも大きな特徴です。また、ある時点の画像(開始フレーム)と別の時点の画像(終了フレーム)を与えると、その間の連続した動きやフレームを予測して合成することも可能です。PredictによってフィジカルAIのトレーニングを行うためのさまざまなシミュレーション環境を無数に作ることができ、AIが次に何が起こるかを予測できるようになるため、より賢い意思決定も可能になります。

 Reasonは、カスタマイズ可能なマルチモーダル推論モデルで、その大きな特徴が「常識の理解」です。物理的な現実を単に見るだけでなく、空間、時間、基本物理法則などの物理世界の基本知識を理解した上で推論するように設計されており、現実世界の状況に即した最良の応答を生成し、ロボットと組み合わせた場合、より複雑な作業をこなせるようになります。

 そしてTransferは、Omniverseなどシミュレーション環境上に作られたデータ(合成データ)を、よりリアルなものに変換・拡張するモデルで、まるで本物の映像のように見える合成データを生成できます。また、環境、照明、視覚的条件などを細かく制御でき、特定のシナリオ(雨の日、夜間、障害物が多い場所など)に対応できるAIを効率的に訓練できます。Transferによってリアルな環境に極めて近い状況でのシミュレーションが可能となり、現実世界とシミュレーター間の差が極めて小さくなります。その結果、開発における手戻りなども少なくなり、開発期間を短縮できます。

人型ロボットの基盤モデルも提供

 「現在、自動車が世界で年間約1億台生産されているが、将来的には世界でヒューマノイドロボット(人型ロボット)が年間数十億台生産されるだろう」――、これは2024年11月に日本で開催されたエヌビディアの大型イベント「NVIDIA AI Summit Japan 2024」において、エヌビディアのジェンスン・フアンCEOが記者向けに質疑応答のセッションで語ったものです。

 AIと現実世界をつなぐインターフェースとしてロボティクス技術がさらに重要となることが見込まれる中、世界に目を移すと人型ロボットへの注目度が高まっています。そうした中、エヌビディアでも人型ロボット向けの基盤モデル「GR00T」(ジーアールゼロゼロティー、通称:グルート)の提案を加速しています。GR00Tには、認知と制御のためのロボット基盤モデル、OmniverseおよびCosmos上に構築されたシミュレーションフレームワーク、合成データと環境を生成するデータパイプラインなどが備わっています。通常、人型ロボットの開発は複雑でコストがかかりますが、GR00Tによって開発者はコア機能をゼロから開発する必要がなくなり、特定のタスクに合わせてカスタマイズするだけで済むようになります。1X、アジリティ・ロボティクス、Apptronik、ボストン・ダイナミクス、フィギュア、Fourier Intelligence、サンクチュアリ、ユニツリー、XPENGといった企業がGR00Tを活用しています。GR00Tは、人型ロボットが人間のように見て、聞いて、理解し、考えて、器用に動けるようになるためのAI基盤ともいえ、エヌビディアが見据える「汎用ロボティクスの時代」における重要な技術といえます。

日本は開発だけでなく、市場としても有望

 フィジカルAIやロボティクス分野に関して、エヌビディアは「自動運転を含めたロボティクス領域はグローバルで投資や開発が進んでおり、日本市場においても引き合いは増えている。また、フィジカルAIに関する産学一体となった動きも増えている」とし、これまでにトヨタ自動車、安川電機、川崎重工業、京セラ、ラピュタロボティクスといった企業が、ロボティクス領域でエヌビディアの技術を活用しています。

 また、エヌビディアは日本について、ロボティクス製品の開発国としてだけでなく、市場としても重要視しており、その理由の一つとして製造業の存在を挙げています。「日本には高度な製造技術を持った現場が多くある。一方で人手不足によって品質の維持や技術継承などが課題となっている。それをカバーするものとしてAIロボットは重要になる。その中で我々としては、ロボットを作りたい、活用したいと思っている方に対して、良いものを簡単に作れるように支援していきたい」と言います。

 エヌビディアの製品は当初ゲームのグラフィック分野で存在感を示し、その後、AIコンピューティング、そしてAIサーバー/データセンターといったAIインフラの中核を担う企業となりました。そのエヌビディアにおいてフィジカルAIの基盤技術やサービスがすでに数多く展開されていることを見ると、今後、高度化されたAIがフィジカルAIとして、ロボットとともに現実世界での活用が進んでいくことになりそうです。

IT Insightの他記事もご覧ください

Prev

Next