論文の概要: The One RING: a Robotic Indoor Navigation Generalist
- arxiv url: http://arxiv.org/abs/2412.14401v1
- Date: Wed, 18 Dec 2024 23:15:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:30:10.454944
- Title: The One RING: a Robotic Indoor Navigation Generalist
- Title(参考訳): The One Ring:ロボットによる室内ナビゲーションのジェネラリスト
- Authors: Ainaz Eftekhar, Luca Weihs, Rose Hendrix, Ege Caglar, Jordi Salvador, Alvaro Herrasti, Winson Han, Eli VanderBil, Aniruddha Kembhavi, Ali Farhadi, Ranjay Krishna, Kiana Ehsani, Kuo-Hao Zeng,
- Abstract要約: RING (Robotic Indoor Navigation Generalist) は、インボディーズ・アグノースティックな政策である。
様々なランダムなエンボディメントを大規模に組み込んだシミュレーションでのみ訓練される。
5つのシミュレーションと4つのロボットプラットフォームで平均72.1%と78.9%の成功率を達成した。
- 参考スコア(独自算出の注目度): 58.431772508378344
- License:
- Abstract: Modern robots vary significantly in shape, size, and sensor configurations used to perceive and interact with their environments. However, most navigation policies are embodiment-specific; a policy learned using one robot's configuration does not typically gracefully generalize to another. Even small changes in the body size or camera viewpoint may cause failures. With the recent surge in custom hardware developments, it is necessary to learn a single policy that can be transferred to other embodiments, eliminating the need to (re)train for each specific robot. In this paper, we introduce RING (Robotic Indoor Navigation Generalist), an embodiment-agnostic policy, trained solely in simulation with diverse randomly initialized embodiments at scale. Specifically, we augment the AI2-THOR simulator with the ability to instantiate robot embodiments with controllable configurations, varying across body size, rotation pivot point, and camera configurations. In the visual object-goal navigation task, RING achieves robust performance on real unseen robot platforms (Stretch RE-1, LoCoBot, Unitree's Go1), achieving an average of 72.1% and 78.9% success rate across 5 embodiments in simulation and 4 robot platforms in the real world. (project website: https://one-ring-policy.allen.ai/)
- Abstract(参考訳): 現代のロボットは、環境を知覚し、相互作用するために使用される形状、大きさ、センサーの構成に大きく異なる。
しかしながら、ほとんどのナビゲーションポリシーは具体化固有のものであり、あるロボットの設定を用いて学習されたポリシーは、通常、他のロボットに優雅に一般化しない。
体の大きさやカメラの視点に小さな変化があっても失敗する可能性がある。
近年のカスタムハードウェア開発の増加に伴い、特定のロボットを訓練(再訓練)する必要がなくなるため、他の実施形態に移行可能な単一のポリシーを学ぶ必要がある。
本稿では,RING(Robotic Indoor Navigation Generalist,ロボット室内ナビゲーションジェネリスト)を導入する。
具体的には、AI2-THORシミュレータを、体のサイズ、回転ピボットポイント、カメラ構成に応じて、制御可能な構成でロボットの実施状況をインスタンス化できるように拡張する。
ビジュアルオブジェクトゴールナビゲーションタスクでは、RINGは本物のロボットプラットフォーム(Stretch RE-1、LoCoBot、UnitreeのGo1)で堅牢なパフォーマンスを達成し、シミュレーションの5つの実施形態と現実世界の4つのロボットプラットフォームで平均72.1%と78.9%の成功率を達成した。
(プロジェクトウェブサイト:https://one-ring-policy.allen.ai/)
関連論文リスト
- Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation [49.03165169369552]
さまざまな種類のロボットにまたがって単一のポリシーを訓練することによって、ロボット学習はより広範囲で多様なデータセットを活用することができる。
そこで我々はCrossFormerを提案する。CrossFormerはスケーラブルでフレキシブルなトランスフォーマーベースのポリシーで、どんな実施形態からでもデータを消費できる。
我々は、同じネットワークウェイトがシングルアームとデュアルアームの操作システム、車輪付きロボット、クワッドコプター、四足歩行など、非常に異なるロボットを制御できることを実証した。
論文 参考訳(メタデータ) (2024-08-21T17:57:51Z) - GRUtopia: Dream General Robots in a City at Scale [65.08318324604116]
本稿では,各種ロボットを対象とした対話型3D社会「GRUtopia」について紹介する。
GRScenesには100万のインタラクティブな微妙な注釈付きシーンが含まれており、都市規模の環境に自由に組み合わせることができる。
GRResidentsはLarge Language Model (LLM)によって駆動されるNon-Player Character (NPC)システムである。
論文 参考訳(メタデータ) (2024-07-15T17:40:46Z) - Octo: An Open-Source Generalist Robot Policy [88.14295917143188]
ここでは,Open X-Embodimentデータセットから800kトラジェクトリをトレーニングした,大規模なトランスフォーマーベースのポリシであるOctoを紹介する。
標準のGPUでは数時間以内に、新しいセンサー入力とアクションスペースを備えたロボットセットアップに効果的にカスタマイズできる。
また,アーキテクチャからトレーニングデータに至るまで,Octoモデルの設計決定の詳細な説明を行い,汎用ロボットモデルの構築に関する今後の研究を指導する。
論文 参考訳(メタデータ) (2024-05-20T17:57:01Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Polybot: Training One Policy Across Robots While Embracing Variability [70.74462430582163]
複数のロボットプラットフォームにデプロイするための単一のポリシーをトレーニングするための重要な設計決定セットを提案する。
われわれのフレームワークは、まず、手首カメラを利用して、我々のポリシーの観察空間と行動空間を具体化して調整する。
6つのタスクと3つのロボットにまたがる60時間以上のデータセットを用いて,関節の形状や大きさの異なるデータセットの評価を行った。
論文 参考訳(メタデータ) (2023-07-07T17:21:16Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。