論文の概要: Dual-Quadruped Collaborative Transportation in Narrow Environments via Safe Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2602.16353v1
- Date: Wed, 18 Feb 2026 10:35:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.537062
- Title: Dual-Quadruped Collaborative Transportation in Narrow Environments via Safe Reinforcement Learning
- Title(参考訳): 安全強化学習による狭い環境におけるデュアル・クアドルプティブ・コラボレーティブ・トランスポーテーション
- Authors: Zhezhi Lei, Zhihai Bi, Wenxin Wang, Jun Ma,
- Abstract要約: 安全強化学習(RL)による二乗四足歩行協調輸送のための新しい手法を提案する。
本稿では,チーム制約の総和を上限以下に抑えるためのコストアドバンテージ分解手法を提案する。
また,各ロボットに共有制約を割り当て,全体のタスク報酬を最大化する制約割当手法を提案する。
- 参考スコア(独自算出の注目度): 7.455739176206637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collaborative transportation, where multiple robots collaboratively transport a payload, has garnered significant attention in recent years. While ensuring safe and high-performance inter-robot collaboration is critical for effective task execution, it is difficult to pursue in narrow environments where the feasible region is extremely limited. To address this challenge, we propose a novel approach for dual-quadruped collaborative transportation via safe reinforcement learning (RL). Specifically, we model the task as a fully cooperative constrained Markov game, where collision avoidance is formulated as constraints. We introduce a cost-advantage decomposition method that enforces the sum of team constraints to remain below an upper bound, thereby guaranteeing task safety within an RL framework. Furthermore, we propose a constraint allocation method that assigns shared constraints to individual robots to maximize the overall task reward, encouraging autonomous task-assignment among robots, thereby improving collaborative task performance. Simulation and real-time experimental results demonstrate that the proposed approach achieves superior performance and a higher success rate in dual-quadruped collaborative transportation compared to existing methods.
- Abstract(参考訳): 複数のロボットが共同でペイロードを輸送するコラボレーティブトランスポーテーションは、近年大きな注目を集めている。
安全かつ高性能なロボット間協調作業は,効果的なタスク実行には不可欠であるが,実現可能な領域が極めて限定された狭い環境での追従は困難である。
この課題に対処するために,安全強化学習(RL)による二乗四足歩行協調輸送の新たなアプローチを提案する。
具体的には、衝突回避を制約として定式化する完全協調型マルコフゲームとしてタスクをモデル化する。
本稿では,チーム制約の総和を上限以下に保ち,RLフレームワーク内でのタスク安全性を確保するためのコストアドバンテージ分解手法を提案する。
さらに,個々のロボットに共有制約を割り当て,全体のタスク報酬を最大化し,ロボット間の自律的なタスク割り当てを促進し,協調作業性能を向上させる制約割当手法を提案する。
シミュレーションおよび実時間実験により,提案手法は既存手法と比較して,二乗二乗連立輸送において優れた性能と高い成功率を達成できることを示した。
関連論文リスト
- BodyGuards: Escorting by Multiple Robots in Unknown Environment under Limited Communication [1.9417191498842037]
マルチロボットシステムは、偵察、災害対応、地下での作戦など、リスクの高い任務にますます配備されている。
本研究は,敵の脅威下での安全を確保しつつ,目標を達成するための操作者の航法時間を最小化するタスク指向探索に焦点を当てる。
新しい護衛フレームワークであるBodyGuardsは、シームレスに協調的な探索、ロボット間通信、護衛を明示的に統合するために提案されている。
論文 参考訳(メタデータ) (2026-03-16T11:02:56Z) - Adaptive Vision-Based Control of Redundant Robots with Null-Space Interaction for Human-Robot Collaboration [7.779638839381672]
人間とロボットのコラボレーションは、ロボットとの協力を通じて人間の能力を拡張することを目的としている。
人間とロボットのコラボレーションが1つのロボット/人間より優れているように、双方のパフォーマンスを向上させることは、未解決の問題である。
タスク空間における適応的視覚に基づく制御項と、ヌル空間における対話的制御項からなる冗長ロボットの新しい制御方式が提案されている。
論文 参考訳(メタデータ) (2026-03-09T08:30:14Z) - Collaborative Planning with Concurrent Synchronization for Operationally Constrained UAV-UGV Teams [12.49123582162583]
コラボレーティブプランニング(Collaborative Planning with Concurrent Synchronization, CoPCS)は、タスクエンコーディングのための異種グラフトランスフォーマーと、共同で同期されたコプランニングのためのトランスフォーマデコーダを統合する学習ベースのアプローチである。
本手法は,同時並行計画の新たなマルチロボット機能を提供し,チームパフォーマンスを大幅に向上させる。
論文 参考訳(メタデータ) (2026-03-06T21:36:25Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Balancing Efficiency and Fairness: An Iterative Exchange Framework for Multi-UAV Cooperative Path Planning [6.14294229178003]
マルチUAV協調経路計画(MU CPP)はマルチエージェントシステムにおける基本的な問題である。
本稿では,MU CPPのための新しい反復交換フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-29T09:41:22Z) - Cooperative Target Detection with AUVs: A Dual-Timescale Hierarchical MARDL Approach [59.81681228738068]
敵の環境では、効率的な協調を実現するとともに、隠蔽活動を確保することが、水中での協力ミッションにとって重要な課題である。
本稿では,新しい時間スケール階層型マルチエージェント・ポリシー最適化フレームワークを提案する。
提案手法は, 高速収束を実現し, ベンチマークアルゴリズムの性能を向上し, 長期協調効率を最大化し, 隠蔽動作の確保を図る。
論文 参考訳(メタデータ) (2025-09-16T09:31:32Z) - Discrete-Guided Diffusion for Scalable and Safe Multi-Robot Motion Planning [56.240199425429445]
マルチロボット運動計画(MPMP)は、共有された連続作業空間で動作する複数のロボットのための軌道を生成する。
離散マルチエージェント探索(MAPF)法は,その拡張性から広く採用されているが,粗い離散化の軌道品質は高い。
本稿では、制約付き生成拡散モデルを用いた離散MAPF解法を導入することにより、2つのアプローチの限界に対処する。
論文 参考訳(メタデータ) (2025-08-27T17:59:36Z) - Uniformly Safe RL with Objective Suppression for Multi-Constraint Safety-Critical Applications [73.58451824894568]
広く採用されているCMDPモデルは予測のリスクを制約しており、長い尾の州で危険な行動を起こす余地がある。
安全クリティカルな領域では、そのような行動は破滅的な結果をもたらす可能性がある。
本稿では,目標を最大化するタスク報酬を適応的に抑制する新しい手法であるObjective Suppressionを提案する。
論文 参考訳(メタデータ) (2024-02-23T23:22:06Z) - SERA: Safe and Efficient Reactive Obstacle Avoidance for Collaborative
Robotic Planning in Unstructured Environments [1.5229257192293197]
本稿では,リアクティブな全身障害物回避手法を提案する。
ロボットアームは、直接接触することなく、任意の3次元形状の障害物を積極的に回避することができる。
本手法は,非定常環境における安全ロボット協調のための堅牢で効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2022-03-24T21:11:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。