論文の概要: Mitigating Data Scarcity in Spaceflight Applications for Offline Reinforcement Learning Using Physics-Informed Deep Generative Models
- arxiv url: http://arxiv.org/abs/2604.02438v1
- Date: Thu, 02 Apr 2026 18:09:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.163739
- Title: Mitigating Data Scarcity in Spaceflight Applications for Offline Reinforcement Learning Using Physics-Informed Deep Generative Models
- Title(参考訳): 物理インフォームド深部生成モデルを用いたオフライン強化学習のための宇宙飛行用データスカシティの緩和
- Authors: Alex E. Ballentine, Nachiket U. Bapat, Raghvendra V. Cowlagi,
- Abstract要約: 宇宙飛行では、高コストで限られた惑星探査データのために、現実世界の訓練データが不足している。
システム識別や合成データ生成といった従来の手法は十分なデータに依存しており、仮説のモデル化や物理に基づく制約の欠如によってしばしば失敗する。
生成モデルに物理に基づく学習バイアスを導入することを提案し、特に、観測されたシステム軌跡と物理ベースのモデルで予測されるものとの違いを学習する物理インフォームドVAE(MI-VAE)を開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The deployment of reinforcement learning (RL)-based controllers on physical systems is often limited by poor generalization to real-world scenarios, known as the simulation-to-reality (sim-to-real) gap. This gap is particularly challenging in spaceflight, where real-world training data are scarce due to high cost and limited planetary exploration data. Traditional approaches, such as system identification and synthetic data generation, depend on sufficient data and often fail due to modeling assumptions or lack of physics-based constraints. We propose addressing this data scarcity by introducing physics-based learning bias in a generative model. Specifically, we develop the Mutual Information-based Split Variational Autoencoder (MI-VAE), a physics-informed VAE that learns differences between observed system trajectories and those predicted by physics-based models. The latent space of the MI-VAE enables generation of synthetic datasets that respect physical constraints. We evaluate MI-VAE on a planetary lander problem, focusing on limited real-world data and offline RL training. Results show that augmenting datasets with MI-VAE samples significantly improves downstream RL performance, outperforming standard VAEs in statistical fidelity, sample diversity, and policy success rate. This work demonstrates a scalable strategy for enhancing autonomous controller robustness in complex, data-constrained environments.
- Abstract(参考訳): 物理システムへの強化学習(RL)ベースのコントローラの展開は、シミュレーション対現実(sim-to-real)ギャップ(sim-to-real)として知られる現実のシナリオへの一般化の貧弱さによって制限されることが多い。
このギャップは、高コストで限られた惑星探査データのために現実世界の訓練データが不足している宇宙飛行では特に困難である。
システム識別や合成データ生成といった従来の手法は十分なデータに依存しており、仮説のモデル化や物理に基づく制約の欠如によってしばしば失敗する。
生成モデルに物理に基づく学習バイアスを導入することにより、このデータ不足に対処することを提案する。
具体的には、観測された系軌跡と物理モデルによる予測値の違いを学習する物理インフォームドVAEであるMI-VAE(Mitual Information-based Split Variational Autoencoder)を開発した。
MI-VAEの潜在空間は、物理的制約を尊重する合成データセットの生成を可能にする。
惑星ランダー問題に対するMI-VAEの評価を行い,実世界の限られたデータとオフラインRLトレーニングに着目した。
その結果,MI-VAEサンプルによるデータセットの増大は,下流RL性能を著しく向上させ,統計忠実度,サンプル多様性,政策成功率において標準VAEよりも優れていた。
この研究は、複雑なデータ制約のある環境で自律コントローラの堅牢性を向上するためのスケーラブルな戦略を示す。
関連論文リスト
- Simulating Realistic LiDAR Data Under Adverse Weather for Autonomous Vehicles: A Physics-Informed Learning Approach [7.735941375698213]
既存の方法は、LiDAR信号と大気現象の間の複雑な相互作用を捉えるのに苦労し、非現実的な表現をもたらす。
本稿では,悪天候下での現実的なLiDARデータ生成のための物理インフォームド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-01T06:36:59Z) - From Physics to Machine Learning and Back: Part II - Learning and Observational Bias in PHM [52.64097278841485]
物理インフォームドモデリングとデータストラテジーによる学習と観察バイアスの導入は、モデルを物理的に一貫した信頼性のある予測へと導くことができるかを検討する。
メタラーニングや少数ショットラーニングなどの高速適応手法をドメイン一般化手法とともに検討する。
論文 参考訳(メタデータ) (2025-09-25T14:15:43Z) - Learning Robust Satellite Attitude Dynamics with Physics-Informed Normalising Flow [2.7222301668137483]
宇宙機の姿勢力学の学習に物理インフォームドニューラルネットワークを組み込むことの利点について検討する。
バシリスクシミュレータで生成されたシミュレーションデータに基づいて複数のモデルを訓練する。
PINNベースのモデルは、制御精度とロバスト性の観点から、純粋にデータ駆動モデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-11T10:50:49Z) - Physics-Learning AI Datamodel (PLAID) datasets: a collection of physics simulations for machine learning [0.15469999759898032]
PLAIDは物理シミュレーションのデータセットを表現および共有するためのフレームワークである。
PLAIDはシミュレーションデータを記述するための統一標準を定義する。
PLAID標準の下で,構造力学と計算流体力学を網羅した6つのデータセットをリリースする。
論文 参考訳(メタデータ) (2025-05-05T18:59:17Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - Offline Robotic World Model: Learning Robotic Policies without a Physics Simulator [50.191655141020505]
強化学習(Reinforcement Learning, RL)は、ロボット制御において目覚ましい能力を示してきたが、高いサンプルの複雑さ、安全性の懸念、そしてシム・トゥ・リアルのギャップのため、依然として困難である。
物理シミュレータに頼らずに政策学習を改善するために不確実性を明示的に推定するモデルベースアプローチであるオフラインロボット世界モデル(RWM-O)を導入する。
論文 参考訳(メタデータ) (2025-04-23T12:58:15Z) - Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models [79.2162092822111]
我々は,一連のナビゲーションタスクにおいて,強化学習(RL)と制御に基づく手法を体系的に評価する。
我々は、JEPA(Joint Embedding Predictive Architecture)を使用して、潜在ダイナミクスモデルを使用し、それを計画に使用します。
その結果,モデルベースプランニングではレイアウトが不明瞭になるのに対して,モデルフリーのRLは高品質なデータから恩恵を受けることがわかった。
論文 参考訳(メタデータ) (2025-02-20T18:39:41Z) - Using Data Assimilation to Train a Hybrid Forecast System that Combines
Machine-Learning and Knowledge-Based Components [52.77024349608834]
利用可能なデータがノイズの多い部分測定の場合,カオスダイナミクスシステムのデータ支援予測の問題を検討する。
動的システムの状態の部分的測定を用いることで、不完全な知識ベースモデルによる予測を改善するために機械学習モデルを訓練できることを示す。
論文 参考訳(メタデータ) (2021-02-15T19:56:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。