論文の概要: Adaptive-Horizon Conflict-Based Search for Closed-Loop Multi-Agent Path Finding
- arxiv url: http://arxiv.org/abs/2602.12024v1
- Date: Thu, 12 Feb 2026 14:55:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.399719
- Title: Adaptive-Horizon Conflict-Based Search for Closed-Loop Multi-Agent Path Finding
- Title(参考訳): Adaptive-Horizon Conflict-based Search for Closed-Loop Multi-Agent Path Finding
- Authors: Jiarui Li, Federico Pecora, Runyu Zhang, Gioele Zardini,
- Abstract要約: MAPFは、倉庫や物流の自動化において、大規模なロボット群の中核的な調整問題である。
既存のアプローチは、固定軌道を生成するオープンループプランナか、信頼性の高い性能保証のないクローズループである。
本稿では,CBSの有限水平変速器をベースとした閉ループであるACCBSについて述べる。
- 参考スコア(独自算出の注目度): 10.628717510399046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: MAPF is a core coordination problem for large robot fleets in automated warehouses and logistics. Existing approaches are typically either open-loop planners, which generate fixed trajectories and struggle to handle disturbances, or closed-loop heuristics without reliable performance guarantees, limiting their use in safety-critical deployments. This paper presents ACCBS, a closed-loop algorithm built on a finite-horizon variant of CBS with a horizon-changing mechanism inspired by iterative deepening in MPC. ACCBS dynamically adjusts the planning horizon based on the available computational budget, and reuses a single constraint tree to enable seamless transitions between horizons. As a result, it produces high-quality feasible solutions quickly while being asymptotically optimal as the budget increases, exhibiting anytime behavior. Extensive case studies demonstrate that ACCBS combines flexibility to disturbances with strong performance guarantees, effectively bridging the gap between theoretical optimality and practical robustness for large-scale robot deployment.
- Abstract(参考訳): MAPFは、倉庫や物流の自動化において、大規模なロボット群の中核的な調整問題である。
既存のアプローチは、固定軌道を生成するオープンループプランナや、信頼性の高いパフォーマンス保証のないクローズループヒューリスティック、安全クリティカルなデプロイメントでの使用を制限するクローズループヒューリスティックなどである。
本稿では, MPC の繰り返し深化にインスパイアされた水平切換機構を備えた, CBS の有限水平変種に基づく閉ループアルゴリズム ACCBS を提案する。
ACCBSは利用可能な計算予算に基づいて計画の水平線を動的に調整し、水平線間のシームレスな遷移を可能にするために単一の制約木を再利用する。
結果として、予算が増加するにつれて漸近的に最適でありながら、高品質な実現可能なソリューションを迅速に生成し、いつでも振舞うことができる。
広範囲にわたるケーススタディでは、ACCBSは障害に対する柔軟性と強力な性能保証を組み合わせ、大規模ロボット展開における理論的最適性と実用的堅牢性の間のギャップを効果的に埋めることを示した。
関連論文リスト
- VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments [19.811711277536187]
マルチロボット探索は通常、フロンティア割り当てをローカルナビゲーションから切り離す。
VORL-EXPLOREは,この制約に対処するハイブリッド学習・計画フレームワークである。
また、グローバルA*ガイダンスとリアクティブ強化学習ポリシーとの間のリスク対応適応的仲裁機構も推進している。
論文 参考訳(メタデータ) (2026-03-09T05:20:33Z) - BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning [49.25750348525603]
BandPOは、信頼領域を動的で確率対応のクリッピング間隔に投影する統一理論演算子であるBandに取って代わる。
BandPOはカノニカルクリッピングやClip-Higherより一貫して優れ,エントロピー崩壊の軽減が図られている。
論文 参考訳(メタデータ) (2026-03-05T08:03:05Z) - Adaptive Linear Path Model-Based Diffusion [52.84663832658799]
リニアパスモデルベース拡散(LP-MBD)を導入し、分散保存スケジュールをフローマッチング線形確率パスに置き換える。
また,適応型LP-MBD(ALP-MBD)を提案し,タスクの複雑さや環境条件に応じて拡散ステップやノイズレベルを調整する。
論文 参考訳(メタデータ) (2026-02-02T21:33:03Z) - QoS-Aware Hierarchical Reinforcement Learning for Joint Link Selection and Trajectory Optimization in SAGIN-Supported UAV Mobility Management [52.15690855486153]
宇宙空間統合ネットワーク (SAGIN) がユビキタスUAV接続を実現するための重要なアーキテクチャとして登場した。
本稿では,SAGINにおけるUAVモビリティ管理を制約付き多目的関節最適化問題として定式化する。
論文 参考訳(メタデータ) (2025-12-17T06:22:46Z) - Logic-informed reinforcement learning for cross-domain optimization of large-scale cyber-physical systems [7.352750348429755]
サイバー物理システムのための論理情報強化学習(LIRL)を提案する。
LIRL は低次元の潜在作用をオンザフライで定義された許容可能なハイブリッド多様体に一階述語論理でマッピングする。
一貫して制約違反をゼロに保ち、最先端のハイブリッドアクション強化学習ベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2025-11-02T05:02:17Z) - Discrete-Guided Diffusion for Scalable and Safe Multi-Robot Motion Planning [56.240199425429445]
マルチロボット運動計画(MPMP)は、共有された連続作業空間で動作する複数のロボットのための軌道を生成する。
離散マルチエージェント探索(MAPF)法は,その拡張性から広く採用されているが,粗い離散化の軌道品質は高い。
本稿では、制約付き生成拡散モデルを用いた離散MAPF解法を導入することにより、2つのアプローチの限界に対処する。
論文 参考訳(メタデータ) (2025-08-27T17:59:36Z) - Hierarchical Budget Policy Optimization for Adaptive Reasoning [49.621779447691665]
階層的予算政策最適化(Hierarchical Budget Policy Optimization, HBPO)は、モデルが問題固有の推論深度を犠牲にすることなく学習できる強化学習フレームワークである。
HBPOは、探索空間を予算制約付き階層(512-2560トークン)に分割する。
大規模な実験により、HBPOは平均トークン使用量を最大60.6%削減し、4つの推論ベンチマークで精度を3.14%改善した。
論文 参考訳(メタデータ) (2025-07-21T17:52:34Z) - Towards Robust Spacecraft Trajectory Optimization via Transformers [17.073280827888226]
我々は,非最適制御問題をリアルタイムに解くための自律生成モデルを開発した。
我々はARTの能力を拡張し、確率制約のある最適制御問題に対処する。
この作業は、宇宙船のような安全クリティカルな自律システムにAI駆動のソリューションを確実に展開するための最初のステップである。
論文 参考訳(メタデータ) (2024-10-08T00:58:42Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。