Fugu-MT 論文翻訳(概要): Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments

論文の概要: Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments

arxiv url: http://arxiv.org/abs/2602.06088v1
Date: Thu, 05 Feb 2026 04:57:58 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-09 22:18:26.033897
Title: Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments
Title（参考訳）: 半可観測環境における自律軌道衝突回避のためのトランスフォーマーによる強化学習
Authors: Thomas Georges, Adam Abdin,
Abstract要約: 自律軌道衝突回避のためのトランスフォーマーに基づく強化学習フレームワークを提案する。この研究の中心的な貢献は、トランスフォーマーベースのPartially Observable Markov Decision Processアーキテクチャの利用である。この統合は、不完全な監視環境下でより確実に動作可能な衝突回避エージェントを訓練するための基盤を提供する。
参考スコア（独自算出の注目度）: 0.3093890460224435
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We introduce a Transformer-based Reinforcement Learning framework for autonomous orbital collision avoidance that explicitly models the effects of partial observability and imperfect monitoring in space operations. The framework combines a configurable encounter simulator, a distance-dependent observation model, and a sequential state estimator to represent uncertainty in relative motion. A central contribution of this work is the use of transformer-based Partially Observable Markov Decision Process (POMDP) architecture, which leverage long-range temporal attention to interpret noisy and intermittent observations more effectively than traditional architectures. This integration provides a foundation for training collision avoidance agents that can operate more reliably under imperfect monitoring environments.
Abstract（参考訳）: 本研究では,自律軌道衝突回避のためのトランスフォーマーに基づく強化学習フレームワークを提案する。フレームワークは、設定可能な遭遇シミュレータ、距離依存観測モデル、およびシーケンシャル状態推定器を組み合わせて、相対運動の不確実性を表す。この研究の中心的な貢献は、変圧器に基づく部分観測可能なマルコフ決定プロセス(POMDP)アーキテクチャの使用である。この統合は、不完全な監視環境下でより確実に動作可能な衝突回避エージェントを訓練するための基盤を提供する。

関連論文リスト

IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文参考訳（メタデータ） (2026-03-03T14:36:46Z)
Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文参考訳（メタデータ） (2025-10-09T04:48:49Z)
Robust Model Predictive Control Design for Autonomous Vehicles with Perception-based Observers [5.388633782438152]
本稿では、状態推定に使用されるディープラーニングに基づく知覚モジュールに固有の非ガウス雑音を明示的に扱う。セットベースの状態推定と制約付きゾノトープを用いて、偏りのある重み付き不確かさをキャプチャする。知覚認識型MPCは、重音条件下での安定かつ正確な制御性能を提供する。
論文参考訳（メタデータ） (2025-09-05T16:03:57Z)
Multi-vessel Interaction-Aware Trajectory Prediction and Collision Risk Assessment [0.3277163122167433]
衝突リスク解析を統合した多容器軌道予測のための変圧器ベースのフレームワークを提案する。大規模実世界のAISデータ上での連成マルチコンテナメトリクスを用いたモデルの評価を行った。
論文参考訳（メタデータ） (2025-09-01T23:38:01Z)
ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [51.07970070817353]
理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文参考訳（メタデータ） (2025-08-19T12:13:41Z)
Inference-Time Gaze Refinement for Micro-Expression Recognition: Enhancing Event-Based Eye Tracking with Motion-Aware Post-Processing [2.5465367830324905]
イベントベースの視線追跡は、きめ細かい認知状態の推測に重要な可能性を秘めている。本稿では、既存の事象に基づく視線推定モデルの出力を高めるために、モデルに依存しない推論時間改善フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-14T14:48:11Z)
Decoupled Dynamics Framework with Neural Fields for 3D Spatio-temporal Prediction of Vehicle Collisions [1.474723404975345]
本研究では,グローバル剛体運動と局所構造変形を独立にモデル化し,3次元車両衝突ダイナミクスを予測するニューラルネットワークフレームワークを提案する。 2つの特殊なネットワークがフレームワークのコアを形成し、四元数ベースの剛性運動のためのRigid Netと局所的な変形のための座標ベースの変形ネットである。利用可能なシミュレーションデータの10%しかトレーニングされていないこのモデルは、予測エラーを最大83%減らし、ベースラインモデルを大幅に上回っている。
論文参考訳（メタデータ） (2025-03-25T14:38:37Z)
Causal Composition Diffusion Model for Closed-loop Traffic Generation [31.52951126032351]
本稿では,これらの課題に対処するための構造誘導拡散フレームワークであるCausal Compositional Diffusion Model (CCDiff)を紹介する。まず、制約付き最適化問題として、制御可能で現実的な閉ループシミュレーションの学習を定式化する。そして、CCDiffは拡散過程に直接因果構造を自動同定し注入することにより、現実主義に固執しながら制御性を最大化する。
論文参考訳（メタデータ） (2024-12-23T19:20:29Z)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳（メタデータ） (2023-12-31T04:14:43Z)
Learned Risk Metric Maps for Kinodynamic Systems [54.49871675894546]
本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。 LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
論文参考訳（メタデータ） (2023-02-28T17:51:43Z)
Interpretable Stochastic Model Predictive Control using Distributional Reinforced Estimation for Quadrotor Tracking Systems [0.8411385346896411]
本研究では,動的・複雑環境下での自律的四角形ナビゲーションのためのトラジェクトリトラッカーを提案する。提案フレームワークは,未知の空力効果に対する分散強化学習推定器をモデル予測制御器に統合する。我々は,未知かつ多様な空気力を用いて,累積追従誤差を少なくとも66%改善するシステムを実証した。
論文参考訳（メタデータ） (2022-05-14T23:27:38Z)
Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文参考訳（メタデータ） (2020-07-28T07:34:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。