Fugu-MT 論文翻訳(概要): Cycle-Consistent World Models for Domain Independent Latent Imagination

論文の概要: Cycle-Consistent World Models for Domain Independent Latent Imagination

arxiv url: http://arxiv.org/abs/2110.00808v1
Date: Sat, 2 Oct 2021 13:55:50 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-06 12:26:45.444057
Title: Cycle-Consistent World Models for Domain Independent Latent Imagination
Title（参考訳）: ドメイン独立潜在イマジネーションのためのサイクル一貫性世界モデル
Authors: Sidney Bender, Tim Joseph, Marius Zoellner
Abstract要約: 高いコストとリスクは、現実世界での自動運転車の訓練を困難にします。本稿では,Cycleconsistent World Modelsと呼ばれる新しいモデルに基づく強化学習手法を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: End-to-end autonomous driving seeks to solve the perception, decision, and control problems in an integrated way, which can be easier to generalize at scale and be more adapting to new scenarios. However, high costs and risks make it very hard to train autonomous cars in the real world. Simulations can therefore be a powerful tool to enable training. Due to slightly different observations, agents trained and evaluated solely in simulation often perform well there but have difficulties in real-world environments. To tackle this problem, we propose a novel model-based reinforcement learning approach called Cycleconsistent World Models. Contrary to related approaches, our model can embed two modalities in a shared latent space and thereby learn from samples in one modality (e.g., simulated data) and be used for inference in different domain (e.g., real-world data). Our experiments using different modalities in the CARLA simulator showed that this enables CCWM to outperform state-of-the-art domain adaptation approaches. Furthermore, we show that CCWM can decode a given latent representation into semantically coherent observations in both modalities.
Abstract（参考訳）: エンドツーエンドの自律運転は、認識、決定、制御の問題を統合的な方法で解決し、大規模に一般化しやすく、新しいシナリオに適応できるようにする。しかし、高いコストとリスクは、現実世界での自動運転車の訓練を非常に困難にします。したがって、シミュレーションはトレーニングを可能にする強力なツールである。わずかに異なる観察のために、シミュレーションでのみ訓練され評価されたエージェントは、しばしばそこでよく機能するが、現実の環境では困難である。そこで本研究では,新しいモデルベース強化学習手法であるcycle consistent world modelを提案する。関連するアプローチとは対照的に、このモデルは2つのモダリティを共有潜在空間に埋め込み、1つのモダリティ(例えばシミュレーションデータ)のサンプルから学習し、異なる領域(例えば実世界データ)での推論に使用できる。 CARLAシミュレータの異なるモードを用いた実験により、CCWMは最先端のドメイン適応手法より優れていることがわかった。さらに、CCWMは、与えられた潜在表現を両方のモードで意味的コヒーレントな観察にデコードできることを示す。

関連論文リスト

Coupled Local and Global World Models for Efficient First Order RL [10.305209288475817]
本稿では,シミュレータを完全に回避し,実環境とロボットのインタラクションから学習した世界モデル内のRLポリシーをトレーニングする手法を提案する。提案手法は,FoG法を用いて,大規模拡散モデルを用いた政策訓練を可能にする。提案手法の有効性をPush-T操作タスクで示し, 試料効率においてPPOを著しく上回る結果を得た。
論文参考訳（メタデータ） (2026-02-05T21:57:41Z)
SimScale: Learning to Drive via Real-World Simulation at Scale [45.08991279559151]
本稿では,既存の運転ログ上に巨大な未確認状態を合成可能な,新規でスケーラブルなシミュレーションフレームワークを提案する。我々のパイプラインは、高度なニューラルレンダリングとリアクティブ環境を利用して、高忠実度マルチビュー観測を生成する。我々は、これらの新しいシミュレーション状態に対する擬似経験的軌跡生成機構を開発し、行動監視を行う。
論文参考訳（メタデータ） (2025-11-28T17:17:38Z)
HybridWorldSim: A Scalable and Controllable High-fidelity Simulator for Autonomous Driving [59.55918581964678]
HybridWorldSimは、静的バックグラウンドのためのマルチトラバースニューラルネットワーク再構成と、動的エージェントの生成モデルを統合するハイブリッドシミュレーションフレームワークである。我々は、様々な都市をまたがる幅広いルートや環境条件をキャプチャーする、新しいマルチトラバースデータセットMIRRORをリリースする。
論文参考訳（メタデータ） (2025-11-27T07:53:16Z)
Revealing the Challenges of Sim-to-Real Transfer in Model-Based Reinforcement Learning via Latent Space Modeling [31.74241286023207]
強化学習(RL)は、ロボット制御や自律運転といった分野において、ますます重要な役割を担っている。シミュレーションと実環境のギャップは、RLの実践的な展開にとって大きな障害となっている。本稿では,シミュレーションが現実の政策改善に与える影響を分析するために,潜在空間に基づくアプローチを提案する。
論文参考訳（メタデータ） (2025-06-15T06:02:42Z)
Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control [97.98560001760126]
複数の空間制御入力に基づいて世界シミュレーションを生成する条件付き世界生成モデルであるCosmos-Transferを導入する。提案したモデルを解析し,ロボット2Realや自律走行車データ豊かさを含む物理AIへの応用を実証するために評価を行う。
論文参考訳（メタデータ） (2025-03-18T17:57:54Z)
RALAD: Bridging the Real-to-Sim Domain Gap in Autonomous Driving with Retrieval-Augmented Learning [25.438771583229727]
本稿では,リアルタイムとシミュレーションのギャップを低コストで埋めるために,自律運転のための検索強化学習(RALAD)を提案する。 RALADは、(1)拡張された最適輸送(OT)メソッドによるドメイン適応、(2)シンプルで統一されたフレームワーク、(3)効率的な微調整技術を含む3つの主要な設計を特徴としている。実験の結果,ALADは実世界のシナリオにおける精度を維持しつつ,シミュレーション環境における性能劣化を補償することを示した。
論文参考訳（メタデータ） (2025-01-21T17:03:06Z)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳（メタデータ） (2024-09-25T06:48:25Z)
Probing Multimodal LLMs as World Models for Driving [72.18727651074563]
自律運転におけるMLLM(Multimodal Large Language Models)の適用について検討する。 GPT-4oのようなモデルの開発は進んでいるが、複雑な運転環境における性能は未解明のままである。
論文参考訳（メタデータ） (2024-05-09T17:52:42Z)
Physics-informed reinforcement learning via probabilistic co-adjustment functions [3.6787556334630334]
両手法の利点を組み合わせた新しい手法として,コクリグ調整 (CKA) とリッジ回帰調整 (RRA) を導入する。本手法は,GPプリエントと統合した自己回帰AR1コクリグモデルに基づく。
論文参考訳（メタデータ） (2023-09-11T12:10:19Z)
Pre-training Contextualized World Models with In-the-wild Videos for Reinforcement Learning [54.67880602409801]
本稿では,視覚制御タスクの学習を効率的に行うために,Wild 動画を多用した事前学習型世界モデルの課題について検討する。本稿では、コンテキストと動的モデリングを明確に分離したContextualized World Models(ContextWM)を紹介する。実験により,ContextWMを内蔵したWildビデオ事前学習は,モデルベース強化学習のサンプル効率を大幅に向上できることが示された。
論文参考訳（メタデータ） (2023-05-29T14:29:12Z)
Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。我々は、切り離された潜在的想像力に基づいて政策最適化を行う。これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文参考訳（メタデータ） (2023-03-27T02:55:56Z)
Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文参考訳（メタデータ） (2021-10-27T04:27:28Z)
DR2L: Surfacing Corner Cases to Robustify Autonomous Driving via Domain Randomization Reinforcement Learning [4.040937987024427]
ドメインランダム化(DR)は、このギャップをほとんど、あるいは全く現実世界のデータで埋めることのできる方法論である。シミュレーションで訓練されたDeepRLベースの自動運転車を強固にするために、敵対モデルが提案されている。
論文参考訳（メタデータ） (2021-07-25T09:15:46Z)
TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。 TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文参考訳（メタデータ） (2021-01-17T00:29:30Z)
From Simulation to Real World Maneuver Execution using Deep Reinforcement Learning [69.23334811890919]
深層強化学習(Deep Reinforcement Learning)は、さまざまな分野における多くの制御タスクを解決できることが証明されている。これは主に、シミュレーションデータと実世界のデータ間のドメイン適応の欠如と、トレインデータセットとテストデータセットの区別の欠如による。本稿では,エージェントが同時に訓練される複数の環境に基づくシステムを提案する。
論文参考訳（メタデータ） (2020-05-13T14:22:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。