論文の概要: PerchRL: Vision-Based Agile Perching on Inclined Platforms under Rapid and Irregular Motion
- arxiv url: http://arxiv.org/abs/2606.03441v1
- Date: Tue, 02 Jun 2026 10:26:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.936712
- Title: PerchRL: Vision-Based Agile Perching on Inclined Platforms under Rapid and Irregular Motion
- Title(参考訳): PerchRL: 迅速かつ不規則な動作下での傾斜プラットフォームにおける視覚ベースのアジャイルアプローチ
- Authors: Zihong Lu, Zongzhuo Liu, Huaxu Li, Jinqiang Cui, Jie Mei, Youmin Gong, U Kei Cheang, Boyu Zhou,
- Abstract要約: PerchRLは、傾斜したプラットフォーム上でのビジョンベースのアジャイルアプローチのための強化学習フレームワークである。
我々は、状態に基づく事前学習と視覚に基づく微調整からなる2段階の学習戦略を採用する。
- 参考スコア(独自算出の注目度): 9.047307073456146
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vision-based perching of quadrotors on moving inclined platforms is critical for air-ground collaboration but remains challenging due to the limited field of view (FOV). In this paper, we propose PerchRL, a reinforcement learning (RL) framework for vision-based agile perching on inclined platforms under rapid and irregular motion. Specifically, we employ a two-stage learning strategy consisting of state-based pre-training followed by vision-based fine-tuning. To improve generalization across diverse platform motions, we employ randomized platform trajectories to prevent overfitting and temporal augmentation methods to capture latent motion patterns from historical observations. During vision-based fine-tuning, a hybrid learning framework consisting of visibility-aware state augmentation and active perception rewards is presented to improve robustness under intermittent visual loss. Extensive simulation and real-world experiments demonstrate the feasibility, stability, and real-time performance of PerchRL, while successful deployment across distinct quadrotor platforms further validates its adaptability. The source code will be released to benefit the community.
- Abstract(参考訳): 傾斜するプラットフォームに対する自律的な視覚に基づく四角形の取り込みは、地上での協調には重要であるが、視野の制限(FOV)のため、依然として困難である。
本稿では,急速かつ不規則な動作下での傾斜プラットフォーム上での視覚に基づくアジャイルエンチングのための強化学習(RL)フレームワークであるPerchRLを提案する。
具体的には、状態に基づく事前学習と視覚に基づく微調整の2段階学習戦略を用いる。
多様なプラットフォーム運動の一般化を改善するために,ランダム化されたプラットフォーム軌道を用いて,過去の観測から潜在動作パターンを捉えるために,過度な適合や時間的拡張を防止している。
視覚に基づく微調整において、視覚的認知状態の増大と能動的知覚報酬からなるハイブリッド学習フレームワークを提示し、間欠的な視覚的損失下での堅牢性を改善する。
大規模なシミュレーションと実世界の実験では、PerchRLの実現可能性、安定性、リアルタイムのパフォーマンスが実証されている。
ソースコードはコミュニティに利益をもたらすためにリリースされます。
関連論文リスト
- NavRL++: A System-Level Framework for Improving Sim-to-Real Transfer in Reinforcement Learning-Based Robot Navigation [9.168410028117089]
我々は、強化学習に基づくナビゲーションのための完全なトレーニングおよびデプロイメントパイプラインを提案する。
我々は、センサノイズ、知覚障害、システム遅延、制御応答など、強化学習に基づくナビゲーションにおけるsim-to-real転送に影響を及ぼす重要な要因を解消する。
本稿では,トランスファーロバスト性を改善するトレーニング後適応戦略である摂動認識ファインチューニングを提案する。
論文 参考訳(メタデータ) (2026-05-15T02:58:25Z) - A Systematic Post-Train Framework for Video Generation [76.26555417456773]
大規模ビデオ拡散モデルでは、高解像度でセマンティックにリッチなコンテンツを生成できることが顕著に示されている。
迅速な感度、時間的不整合、禁止的推論コストといった重要な問題のために、事前訓練されたパフォーマンスと実際のデプロイメント要件の間には、大きなギャップが残っている。
本研究では,事前学習されたモデルとユーザの意図を4つの相乗的段階を通して体系的に整合させる総合的なポストトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-28T09:34:51Z) - Gym-V: A Unified Vision Environment System for Agentic Vision Research [51.62136909074774]
Gym-Vは、手続き的に生成された10ドメインにわたる179の視覚環境の統一プラットフォームであり、制御が難しい。
我々は,RLアルゴリズムの選択よりも,観測足場がトレーニングの成功に決定的であることを見出した。
クロスドメイン転送実験は、多様なタスクのトレーニングが広範囲に一般化され、狭いトレーニングが負の転送を引き起こすことを示している。
論文 参考訳(メタデータ) (2026-03-16T15:37:07Z) - Self-Correcting VLA: Online Action Refinement via Sparse World Imagination [55.982504915794514]
本稿では, 自己補正VLA (SC-VLA) を提案する。
SC-VLAは最先端のパフォーマンスを達成し、最高タスクスループットを16%削減し、最高パフォーマンスのベースラインよりも9%高い成功率を得る。
論文 参考訳(メタデータ) (2026-02-25T06:58:06Z) - From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - MoSiC: Optimal-Transport Motion Trajectory for Dense Self-Supervised Learning [66.53533434848369]
密集した表現を学習する動き誘導型自己学習フレームワークを提案する。
6つの画像およびビデオデータセットと4つの評価ベンチマークにおいて、最先端を1%から6%改善する。
論文 参考訳(メタデータ) (2025-06-10T11:20:32Z) - Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight [20.92646531472541]
本稿では,Reinforcement Learning(RL)とImitation Learning(IL)のサンプル効率を組み合わせた新しいアプローチを提案する。
本フレームワークは、RLを用いた3段階の教員政策と、ILによる学生政策に蒸留する特権状態情報と、RLによる適応微調整とを含む。
テストでは、スクラッチからRLが失敗するシナリオだけでなく、ロバストさとパフォーマンスの両方で既存のILメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-03-18T19:25:57Z) - Learning to Jump from Pixels [23.17535989519855]
我々は、高度にアジャイルな視覚的誘導行動の合成法であるDepth-based Impulse Control (DIC)を提案する。
DICは、モデルフリー学習の柔軟性を提供するが、地面反応力の明示的なモデルベース最適化により、振る舞いを規則化する。
提案手法をシミュレーションと実世界の両方で評価する。
論文 参考訳(メタデータ) (2021-10-28T17:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。