論文の概要: RSC: Decentralized Rigid Formation Flocking for Large-Scale Swarms via Hybrid Predictive Control and Online Reconfiguration
- arxiv url: http://arxiv.org/abs/2606.04248v1
- Date: Tue, 02 Jun 2026 21:54:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.400393
- Title: RSC: Decentralized Rigid Formation Flocking for Large-Scale Swarms via Hybrid Predictive Control and Online Reconfiguration
- Title(参考訳): RSC:ハイブリッド予測制御とオンライン再構成による大規模群集のための分散型剛体形成ロック
- Authors: Ganyu Zou, Linhan Wang, Chen Dai, Siji Chen, Chang-Tien Lu,
- Abstract要約: 分散化された剛体形成の群れは、移動中に所定の幾何学的構成を維持するために自律的なエージェント群を必要とする。
既存の分散制御手法は、散在環境において厳密なエージェント間距離制約を維持するのに苦労する。
本稿では,大規模な剛性形成フロッキングのための分散制御フレームワークであるRigid Swarm Control (RSC)を提案する。
- 参考スコア(独自算出の注目度): 13.510884015809735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decentralized rigid formation flocking requires a swarm of autonomous agents to maintain a predetermined geometric configuration while moving, relying solely on local sensing and communication. However, existing decentralized control methods struggle to maintain strict inter-agent distance constraints in cluttered environments, often suffering from local minima deadlocks, high frequency control oscillations, or limited flexibility during obstacle navigation, resulting in low success rate. To address these limitations, we propose Rigid Swarm Control (RSC), a decentralized control framework for large-scale rigid formation flocking. To escape local minima via robust long-term planning while ensuring short-term safety, RSC integrates finite-horizon trajectory predictions with a reactive artificial potential field (APF) safety controller within a hybrid architecture. Furthermore, to accelerate formation reassembly after obstacle traversal without interrupting task execution, RSC introduces an online leader-follower reconfiguration mechanism based on stable role exchange. Extensive evaluations in challenging cluttered environments with 25 UAVs demonstrate that RSC reliably unifies rigid formation maintenance, obstacle avoidance, and target tracking. Under strict success criteria - collision-free operation with a maximum relative edge-length error below 10%, RSC achieves an 83% success rate, significantly outperforming existing heuristic and learning-based baselines that fall below 5%.
- Abstract(参考訳): 分散化された剛体形成の群れは、局所的なセンシングと通信にのみ依存し、移動中に所定の幾何学的構成を維持するために自律的なエージェントの群れを必要とする。
しかし、既存の分散制御手法では、局所的なミニマムデッドロック、高周波制御の発振、障害物ナビゲーション時の柔軟性に悩まされ、乱雑な環境において厳密なエージェント間距離の制約を維持するのに苦労し、成功率を低下させる。
これらの制約に対処するため,大規模に剛性を形成するための分散制御フレームワークであるRigid Swarm Control (RSC)を提案する。
短期的安全性を確保しつつ、ロバストな長期計画を通じて局所最小化を回避するため、RCCは、有限水平軌道予測と反応性人工電位場(APF)安全コントローラをハイブリッドアーキテクチャに統合する。
さらに,タスク実行を中断することなく障害物移動後の再編成を高速化するために,安定した役割交換に基づくオンラインリーダ・フォロワー再構成機構を導入する。
25UAVの難易度の高い環境における広範囲な評価は、RCCが堅固な形成維持、障害物回避、目標追跡を確実に統一することを証明している。
厳密な成功基準の下では、衝突のない最大エッジ長誤差を10%未満で行うと、RCCは83%の成功率に達し、既存のヒューリスティックおよび学習ベースラインを5%未満で上回ります。
関連論文リスト
- RCSP: Risk-Sensitive Conjectural Scenario Planning for Safe Dynamic Robot Navigation [16.960126375377133]
リスク感性行動シナリオ計画(RCSP)は、予測可能な短水平障害物の将来に対する候補命令を評価する計画層である。
制御された MuJoCo ボトルネックタスクでは、RCSP プランナーは衝突することなく目標を達成することができ、より高い二次安全性とパス品質の点推定が得られる。
論文 参考訳(メタデータ) (2026-05-25T21:47:36Z) - Learning Reactive Dexterous Grasping via Hierarchical Task-Space RL Planning and Joint-Space QP Control [50.28263951510334]
本稿では,リアクティブなデクスタリーグルーピングのためのハイブリッド階層型制御フレームワークを提案する。
提案手法は,低レベル共同実行から高レベル空間意図を明示的に分離する。
我々は厳密なシミュレーションと現実のパイプラインを通して提案したフレームワークを広範囲に検証する。
論文 参考訳(メタデータ) (2026-05-05T04:49:38Z) - RAD-2: Scaling Reinforcement Learning in a Generator-Discriminator Framework [49.531001563853984]
RAD-2はクローズドループ計画のための統一されたジェネレータ・ディスクリミネーターフレームワークである。
様々な軌道候補を生成する一方、RL最適化判別器は、これらの候補を長期的な運転品質に応じて再現する。
強い拡散ベースのプランナーに比べて衝突速度を56%削減する。
論文 参考訳(メタデータ) (2026-04-16T17:59:44Z) - DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning [62.347535250646196]
本稿では、ロバストでスケーラブルなシロコラボ型IoTアプリケーションスケジューリングのための分散フェデレーション強化学習フレームワークであるDeFRiSを提案する。
DeFRiSは、(i)異種サイロ間のシームレスな知識伝達を可能にするための候補資源スコアを利用したアクション空間非依存ポリシー、(ii)汎用アドバンテージ推定とクリッピングされたポリシー更新を組み合わせたサイロ最適化ローカル学習メカニズム、(iii)類似性認識の知識伝達と異常検出に勾配指紋を利用するDual-Track Non-IIDロバストな分散集約プロトコル、の3つのイノベーションを統合する。
論文 参考訳(メタデータ) (2026-03-16T02:02:38Z) - VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments [19.811711277536187]
マルチロボット探索は通常、フロンティア割り当てをローカルナビゲーションから切り離す。
VORL-EXPLOREは,この制約に対処するハイブリッド学習・計画フレームワークである。
また、グローバルA*ガイダンスとリアクティブ強化学習ポリシーとの間のリスク対応適応的仲裁機構も推進している。
論文 参考訳(メタデータ) (2026-03-09T05:20:33Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Boundary-to-Region Supervision for Offline Safe Reinforcement Learning [56.150983204962735]
バウンダリ・トゥ・レギオン(Bundary-to-Region, B2R)は、コスト信号による非対称な条件付けを可能にするフレームワークである。
B2Rは、CTGを固定された安全予算の下で境界制約として再定義し、すべての実行可能な軌道のコスト分布を統一する。
実験の結果,B2Rは38項目中35項目の安全制約を満たすことがわかった。
論文 参考訳(メタデータ) (2025-09-30T03:38:20Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Learned Risk Metric Maps for Kinodynamic Systems [54.49871675894546]
本研究では,高次元力学系のコヒーレントリスクメトリクスをリアルタイムに推定するための学習型リスクメトリクスマップを提案する。
LRMMモデルは設計と訓練が簡単で、障害セットの手続き的生成、状態と制御のサンプリング、および関数近似器の教師付きトレーニングのみを必要とする。
論文 参考訳(メタデータ) (2023-02-28T17:51:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。