論文の概要: Autonomous Aerial Manipulation via Contextual Contrastive Meta Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2606.08533v1
- Date: Sun, 07 Jun 2026 09:26:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.190802
- Title: Autonomous Aerial Manipulation via Contextual Contrastive Meta Reinforcement Learning
- Title(参考訳): 文脈コントラストメタ強化学習による自律的空気マニピュレーション
- Authors: Lixuan Jin, Bingxuan Lan, Xinyi Bao, Xiangyuan Xie, Chunjie Zhang, Zheng Chen, Tianshuo Liu, Ruijie Tian, Jinyu Ru, Gang Wang, Lei Yuan, Yang Yu,
- Abstract要約: 無人航空機(UAV)は、ロジスティクス、サービスロボティクス、その他の現実世界の用途にますます配備されている。
既存のアプローチでは、通常、事前に設定されたペイロードを仮定するか、特別なグリップに依存する。
そこで本研究では,軽量フックを備えたクオードロータが連続的にピックアップし,搬送し,多様なハンドル付き物体を届ける,完全自律型空中配送環境を提案する。
- 参考スコア(独自算出の注目度): 16.454878732635738
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unmanned aerial vehicles (UAVs) are increasingly being deployed in logistics, service robotics, and other real-world applications, creating a growing demand for autonomous payload acquisition and delivery. Existing approaches typically assume pre-attached payloads or rely on specialized grippers, leaving versatile end-to-end aerial delivery largely unresolved, where different payloads induce highly variable flight dynamics, requiring a single policy to adapt online without manual calibration or explicit system identification. To this end, we study \textbf{A}utonomous \textbf{A}erial Manipulation via \textbf{Co}ntextual \textbf{Co}ntrastive Meta Reinforcement Learning (\textbf{\textit{Aco2}}), a fully autonomous aerial delivery setting in which a quadrotor equipped with a lightweight hook continuously picks up, transports, and delivers diverse handle-equipped objects between randomized locations, all without human intervention. First, we design a contextual observation encoder that infers a compact latent context from recent interaction history, enabling the policy to adapt online to payload-dependent dynamics. To further improve the quality of this context, we introduce a contrastive objective that structures the context embedding around task-relevant variations, improving generalization across diverse payloads without requiring explicit system identification. Trained entirely in simulation with extensive domain randomization, \textit{Aco2} can be directly deployed on a physical quadrotor without real-world fine-tuning.
- Abstract(参考訳): 無人航空機(UAV)は、ロジスティクス、サービスロボティクス、その他の現実世界のアプリケーションにますます配備され、自律的なペイロードの取得と配送に対する需要が高まっている。
既存のアプローチでは、プリアタッチされたペイロードを前提とするか、特別なグリップを頼りにしており、様々なペイロードが高度に変動する飛行力学を誘導し、手動のキャリブレーションや明示的なシステム識別なしにオンラインで適応するための単一のポリシーを必要とする、汎用的なエンドツーエンドの航空輸送はほとんど未解決のままである。
この目的のために、軽量なフックを備えたクオードロータが連続的にピックアップし、輸送し、ランダムな場所間で様々なハンドルを持つ物体を届ける完全自律的空中配送環境である、 \textbf{A}utonomous \textbf{A}erial Manipulation via \textbf{Co}ntextual \textbf{Co}ntrastive Meta Reinforcement Learning (\textbf{\textit{Aco2}})について検討した。
まず、最近のインタラクション履歴からコンパクトな潜在コンテキストを推定するコンテキスト観測エンコーダを設計し、そのポリシーをペイロード依存のダイナミックスに適応させる。
この文脈の質をさらに向上するために、タスク関連変動に埋め込まれたコンテキストを構造化するコントラッシブな目的を導入し、明示的なシステム識別を必要とせず、多様なペイロードをまたいだ一般化を改善する。
広範囲な領域ランダム化を伴うシミュレーションで完全に訓練された \textit{Aco2} は、現実世界の微調整をせずに、物理的二次体に直接展開することができる。
関連論文リスト
- VAIC: Vision-Guided Humanoid Agile Object Interaction Control via Decoupled Commands [56.029505206531155]
Vision Guided Agile Interaction Control (VAIC)は、現在のコントローラとヒューマノイドロボットのギャップを埋める統合フレームワークである。
まず、特権教師政策は、正確な物体運動学と正確な環境状態を用いて多様な相互作用スキルを習得する。
第二に、デプロイ可能な学生ポリシーは、全体追跡を複数の軸にまたがる速度目標に置き換えることで、これらの能力を蒸留する。
論文 参考訳(メタデータ) (2026-06-08T09:52:55Z) - Learning Terrain-Aware Whole-Body Control for Perceptive Legged Loco-Manipulation [2.915167691607446]
我々は,足のマニピュレータのための地形対応全体制御フレームワークTA-WBCを紹介する。
我々は、地形の特徴を抽出するためにハイブリッド・エクセプション・エンコーダを用いており、ロボットが姿勢や足場を積極的に適応するための重要な基盤となっている。
安定なクロステランのロコ操作を容易にするため,フット接触面に基づく新しいエンドエフェクタサンプリング法を提案する。
論文 参考訳(メタデータ) (2026-05-29T14:22:10Z) - The Unified Autonomy Stack: Toward a Blueprint for Generalizable Robot Autonomy [13.105188128582567]
我々は,空と地上のロボット形態を横断するレジリエンスな自律を可能にするシステムレベルのソリューションであるUnified Autonomy Stackを紹介し,オープンソース化する。
アーキテクチャは、マルチモーダル認識、マルチビヘイビア計画、マルチレイヤセーフナビゲーションの3つのモジュールを中心にしている。
このスタックは、地上(ロータークラフト)ロボットと地上(レッグ)ロボットの両方でフィールドテストされ、検証されている。
論文 参考訳(メタデータ) (2026-05-12T20:39:35Z) - Plan in Sandbox, Navigate in Open Worlds: Learning Physics-Grounded Abstracted Experience for Embodied Navigation [63.11032720821731]
textitSAGEは、エージェントがフォトリアリスティックなシミュレーションではなく、物理基底のセマンティック抽象化内で学習することを可能にするフレームワークである。
textitSAGEは、A-EQA上で53.21% LLM-Match Success Rateを達成することで、プランナー支援の実施ナビゲーションを大幅に改善することを示した。
論文 参考訳(メタデータ) (2026-05-11T07:34:30Z) - ACLM: ADMM-Based Distributed Model Predictive Control for Collaborative Loco-Manipulation [9.708461585583791]
重荷のロコ操作による共同輸送は、脚のあるロボットにとって難しいが必須の能力である。
本研究は,ロコマニピュレーションのための分散モデル予測制御フレームワークであるマルチプライアの交互方向法を提案する。
論文 参考訳(メタデータ) (2026-03-07T08:06:51Z) - PILOT: A Perceptive Integrated Low-level Controller for Loco-manipulation over Unstructured Scenes [18.916978556216097]
PILOTは知覚的ロコ操作に適した単段階強化学習フレームワークである。
知覚的な移動と1つのポリシー内での全身制御をシナジー化する。
PILOTは、既存のベースラインと比較して、安定性、コマンド追跡精度、地形トラバーサビリティが優れている。
論文 参考訳(メタデータ) (2026-01-24T12:25:20Z) - Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.49978559936122]
本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。
提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。
我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文 参考訳(メタデータ) (2025-09-27T19:43:04Z) - Diffusion Transformer Policy [48.50988753948537]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。
トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文 参考訳(メタデータ) (2024-10-21T12:43:54Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。