論文の概要: Global End-Effector Pose Control of an Underactuated Aerial Manipulator via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.21085v2
- Date: Tue, 10 Mar 2026 22:15:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.502253
- Title: Global End-Effector Pose Control of an Underactuated Aerial Manipulator via Reinforcement Learning
- Title(参考訳): 強化学習による非動翼マニピュレータのグローバルエンドエフェクタポース制御
- Authors: Shlok Deshmukh, Javier Alonso-Mora, Sihao Sun,
- Abstract要約: ロボットアームとマルチロータードローンを組み合わせた空中マニピュレータは、アームの重量と機械的複雑さに厳しい制約に直面している。
本研究では,2自由度2自由度(DoF)アームを,6自由度エンドエフェクタのフルポーズ制御が可能な差動機構を用いて検討した。
- 参考スコア(独自算出の注目度): 15.634803296068009
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Aerial manipulators, which combine robotic arms with multi-rotor drones, face strict constraints on arm weight and mechanical complexity. In this work, we study a lightweight 2-degree-of-freedom (DoF) arm mounted on a quadrotor via a differential mechanism, capable of full six-DoF end-effector pose control. While the minimal design enables simplicity and reduced payload, it also introduces challenges such as underactuation and sensitivity to external disturbances. To address these, we employ reinforcement learning, training a Proximal Policy Optimization (PPO) agent in simulation to generate feedforward commands for quadrotor acceleration and body rates, along with joint angle targets. These commands are tracked by an incremental nonlinear dynamic inversion (INDI) attitude controller and a PID joint controller, respectively. Flight experiments demonstrate centimeter-level position accuracy and degree-level orientation precision, with robust performance under external force disturbances, including manipulation of heavy loads and pushing tasks. The results highlight the potential of learning-based control strategies for enabling contact-rich aerial manipulation using simple, lightweight platforms. Videos of the experiment and the method are summarized in https://youtu.be/bWLTPqKcCOA.
- Abstract(参考訳): ロボットアームとマルチロータードローンを組み合わせた空中マニピュレータは、アームの重量と機械的複雑さに厳しい制約に直面している。
本研究では,2自由度2自由度(DoF)の軽量アームを,6自由度エンドエフェクタのフルポーズ制御が可能な差動機構を用いて研究する。
最小限の設計は単純さとペイロード削減を可能にするが、不活性化や外乱に対する感度といった課題も導入している。
これらの問題に対処するために、我々は強化学習、PPOエージェントをシミュレーションで訓練し、四角子加速度と体率のフィードフォワードコマンドと関節角度目標を生成する。
これらのコマンドは、インクリメンタル非線形ダイナミックインバージョン(INDI)姿勢コントローラとPIDジョイントコントローラによって追跡される。
飛行実験では、重負荷の操作や押し作業を含む外部の力乱下での堅牢な性能で、センチメートルレベルの位置精度と等級レベルの方向精度が実証された。
この結果は,シンプルで軽量なプラットフォームを用いたコンタクトリッチ空中操作を実現するための学習ベースの制御戦略の可能性を強調した。
実験と方法のビデオはhttps://youtu.be/bWLTPqKcCOA.comで要約されている。
関連論文リスト
- ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Safe Whole-Body Loco-Manipulation via Combined Model and Learning-based Control [46.47619556874003]
そこで本研究では,マニピュレータアームのモデルベースアプタンス制御と足歩行の強化学習ポリシを組み合わせた全身制御を提案する。
アクセタンスコントローラは、物理的相互作用中に人間によって適用されるような外部レンチを、望ましいエンドエフェクタ速度にマッピングし、従順な振る舞いを可能にする。
6-DoFアームと手首に装着した6-DoF Force/Torqueセンサーを備えたUnitree Go2四足歩行ロボットを用いて,シミュレーションとハードウェアの両方におけるアプローチを検証する。
論文 参考訳(メタデータ) (2026-03-02T22:31:12Z) - Learning Agile and Robust Omnidirectional Aerial Motion on Overactuated Tiltable-Quadrotors [15.511018281264674]
本研究は, 過動型傾斜四角形における全方向空中運動制御のための強化学習について検討する。
本稿では,目標ポーズに到達するための協調ロータ接合動作の効率的な獲得を可能にする学習ベース制御フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-25T05:13:25Z) - UniForce: A Unified Latent Force Model for Robot Manipulation with Diverse Tactile Sensors [51.88112610411651]
そこで本研究では,多様な触覚センサにまたがる共用潜在力空間を学習する,新しい統合された触覚表現学習フレームワークを提案する。
UniForceは、逆ダイナミクス(image-to-force)とフォワードダイナミクス(force-to-image)を共同モデリングすることで、クロスセンサー領域シフトを低減する
高価な外部力/トルクセンサ(F/T)への依存を避けるため,静的平衡を利用して直接センサ・オブジェクト・センサ・インタラクションを介して力対効果データを収集する。
論文 参考訳(メタデータ) (2026-02-01T11:03:01Z) - Beyond Prompt Engineering: Robust Behavior Control in LLMs via Steering Target Atoms [71.85633762642125]
モデルにおける膨大な数のパラメータは、しばしば高度に絡み合った内部表現をもたらす。
最近の研究は、スパースオートエンコーダ(SAE)を用いて、ステアリングのための高次元空間における知識を歪めている。
本研究では,非絡み合った知識コンポーネントを分離・操作し,安全性を高める手法であるステアリングターゲット原子(STA)を提案する。
論文 参考訳(メタデータ) (2025-05-23T17:59:18Z) - Inverted Landing in a Small Aerial Robot via Deep Reinforcement Learning
for Triggering and Control of Rotational Maneuvers [11.29285364660789]
高速で頑健な逆着陸は、特に機内でのセンシングと計算に完全に依存しながらも、空中ロボットにとって難しい偉業である。
これまでの研究では、一連の視覚的手がかりとキネマティックな動作の間に直接的な因果関係が特定され、小型の空中ロボットでこの困難なエアロバティックな操作を確実に実行することができた。
本研究では、まずDeep Reinforcement Learningと物理シミュレーションを用いて、頑健な逆着陸のための汎用的最適制御ポリシーを得る。
論文 参考訳(メタデータ) (2022-09-22T14:38:10Z) - Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing [42.27572349747162]
本研究では,空中すべり作業に対する学習に基づく適応制御手法を提案する。
提案するコントローラ構造は,データ駆動制御とモデルベース制御を組み合わせたものである。
美術品間相互作用制御手法の微調整状態と比較して,追従誤差の低減と外乱拒否の改善を実現した。
論文 参考訳(メタデータ) (2022-06-28T16:28:59Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Towards Safe Control of Continuum Manipulator Using Shielded Multiagent
Reinforcement Learning [1.2647816797166165]
ロボットの制御は、MADQNフレームワークにおける1つのエージェント問題である1-DoFとして定式化され、学習効率が向上する。
シールドされたMADQNにより、ロボットは外部負荷下で、サブミリ単位のルート平均二乗誤差で点と軌道追跡を行うことができた。
論文 参考訳(メタデータ) (2021-06-15T05:55:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。