論文の概要: Out-of-Distribution Generalization with a SPARC: Racing 100 Unseen Vehicles with a Single Policy
- arxiv url: http://arxiv.org/abs/2511.09737v1
- Date: Fri, 14 Nov 2025 01:07:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.452444
- Title: Out-of-Distribution Generalization with a SPARC: Racing 100 Unseen Vehicles with a Single Policy
- Title(参考訳): SPARCによるアウト・オブ・ディストリビューションの一般化:単一ポリシー付きレーシング100車両
- Authors: Bram Grooten, Patrick MacAlpine, Kaushik Subramanian, Peter Stone, Peter R. Wurman,
- Abstract要約: エージェントが様々な文脈で環境の中で行動する文脈強化学習に焦点をあてる。
テスト時に明示的なコンテキスト情報にアクセスすることなく、アウト・オブ・ディストリビューション(OOD)設定を一般化する重要な課題に取り組む。
我々は方法論を単純化し、ロバスト制御のための単相適応を導入する。
- 参考スコア(独自算出の注目度): 16.979984578691912
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalization to unseen environments is a significant challenge in the field of robotics and control. In this work, we focus on contextual reinforcement learning, where agents act within environments with varying contexts, such as self-driving cars or quadrupedal robots that need to operate in different terrains or weather conditions than they were trained for. We tackle the critical task of generalizing to out-of-distribution (OOD) settings, without access to explicit context information at test time. Recent work has addressed this problem by training a context encoder and a history adaptation module in separate stages. While promising, this two-phase approach is cumbersome to implement and train. We simplify the methodology and introduce SPARC: single-phase adaptation for robust control. We test SPARC on varying contexts within the high-fidelity racing simulator Gran Turismo 7 and wind-perturbed MuJoCo environments, and find that it achieves reliable and robust OOD generalization.
- Abstract(参考訳): 見えない環境への一般化は、ロボット工学と制御の分野で重要な課題である。
本研究では,自律走行車や四足歩行ロボットのような,訓練対象の異なる地形や天候条件で操作する必要がある環境下でエージェントが行動する,文脈強化学習に焦点を当てる。
テスト時に明示的なコンテキスト情報にアクセスすることなく、アウト・オブ・ディストリビューション(OOD)設定を一般化する重要な課題に取り組む。
最近の研究は、コンテキストエンコーダと履歴適応モジュールを別々の段階でトレーニングすることでこの問題に対処している。
有望ではあるが、この2段階のアプローチは実装とトレーニングが面倒だ。
方法論を単純化し、堅牢な制御のための単相適応であるSPARCを導入する。
高忠実度レースシミュレータGran Turismo 7と風洞型MuJoCo環境の様々な状況でSPARCを試験し、信頼性とロバストなOOD一般化を実現する。
関連論文リスト
- Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - Heterogeneous Robot Collaboration in Unstructured Environments with Grounded Generative Intelligence [54.91177026001217]
大規模言語モデル(LLM)対応のチーム化手法は、よく構造化された既知の環境を前提とするのが一般的である。
異種ロボットチームにおけるLCMの推論能力を基盤として,これらの制約に対処するフレームワークであるSPINE-HTを提案する。
我々のフレームワークは、従来のLLM対応の不均一なチームリング手法と比較して、ほぼ2倍の成功率を達成する。
論文 参考訳(メタデータ) (2025-10-30T18:24:38Z) - VehicleWorld: A Highly Integrated Multi-Device Environment for Intelligent Vehicle Interaction [78.34534983766973]
VehicleWorldは、30のモジュール、250のAPI、680のプロパティを備えた、自動車ドメインのための最初の包括的な環境である。
本研究では,システム状態認識を明示的に維持し,目標条件を達成するために直接状態遷移を実装する新しい手法であるState-based Function Call (SFC)を提案する。
論文 参考訳(メタデータ) (2025-09-08T14:28:25Z) - Multi-Agent Deep Reinforcement Learning for Cooperative and Competitive
Autonomous Vehicles using AutoDRIVE Ecosystem [1.1893676124374688]
我々は、ニジェールとF1TENTHの物理的に正確でグラフィカルなデジタル双対を開発するために、AutoDRIVE Ecosystemを導入する。
まず,複数エージェントの学習環境だけでなく,限られた状態情報を相互に共有する一組の協調車両(Nigel)を用いた交差点問題について検討する。
次に、異なる車両群(F1TENTH)を用いて、個別のポリシーアプローチを用いたマルチエージェント学習環境において、対向的なヘッドツーヘッド自律レース問題を調査する。
論文 参考訳(メタデータ) (2023-09-18T02:43:59Z) - Discrete Control in Real-World Driving Environments using Deep
Reinforcement Learning [2.467408627377504]
本研究では,現実の環境をゲーム環境に移行させる,現実の運転環境におけるフレームワーク(知覚,計画,制御)を紹介する。
実環境における離散制御を学習し,実行するために,既存の強化学習(RL)アルゴリズムを多エージェント設定で提案する。
論文 参考訳(メタデータ) (2022-11-29T04:24:03Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for
Autonomous Driving [96.50297622371457]
マルチエージェントインタラクションは、現実の世界における自律運転の基本的な側面である。
研究と開発が10年以上続いたにもかかわらず、様々なシナリオで多様な道路ユーザーと対話する方法の問題は未解決のままである。
SMARTSと呼ばれる,多種多様な運転インタラクションを生成する専用シミュレーションプラットフォームを開発した。
論文 参考訳(メタデータ) (2020-10-19T18:26:10Z) - Interpretable End-to-end Urban Autonomous Driving with Latent Deep
Reinforcement Learning [32.97789225998642]
本稿では,エンドツーエンド自動運転のための解釈可能な深部強化学習手法を提案する。
逐次潜在環境モデルを導入し、強化学習プロセスと共同で学習する。
本手法は,自動車が運転環境にどう影響するかを,よりよく説明することができる。
論文 参考訳(メタデータ) (2020-01-23T18:36:35Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。