論文の概要: Deep-Unfolded Coordination
- arxiv url: http://arxiv.org/abs/2606.19920v1
- Date: Thu, 18 Jun 2026 08:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.72531
- Title: Deep-Unfolded Coordination
- Title(参考訳): Deep-Unfolded Coordination
- Authors: Hunter Kuperman, Minchan Jung, Rahul V. Ghosh, Alex Oshin, Evangelos A. Theodorou,
- Abstract要約: Deep CoordinatorはADMM-DDPのチューニングを動的に調整するディープアンフォールディングフレームワークである。
Deep Coordinatorは従来の解法に比べて6.18-9.44倍の品質を実現している。
- 参考スコア(独自算出の注目度): 14.215090107491754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distributed optimization is a highly scalable and structurally transparent technique to solve multi-agent robotics problems; however, such methods often suffer from the need for highly-specialized, problem-specific hyperparameter tunings. In this work, we propose Deep Coordinator, a deep-unfolding framework that learns to dynamically adjust the hyperparameters of ADMM-DDP, a popular distributed solver for robotics tasks, at solve-time in response to optimizer performance. Our architecture consists of unrolling a fixed number of ADMM-DDP iterations into a neural network with learnable functions between layers mapping the optimizer state to the next hyperparameters. To the best of our knowledge, Deep Coordinator is the first deep-unfolding framework to adapt the penalty parameters of a non-convex optimizer at solve-time; we show that the mainstream supervised approach can yield degenerate solutions when training such models, and propose an unsupervised learning scheme. On simulations with fleets of cars and quadrotors, Deep Coordinator produces trajectories of comparable quality 6.18-9.44x faster than conventional solvers. Furthermore, Deep Coordinator retains its performance benefits when deployed to systems up to 8x larger than trained on.
- Abstract(参考訳): 分散最適化は多エージェントロボット問題を解決するための高度にスケーラブルで構造的に透明な手法であるが、そのような手法は高度に特殊化された問題固有のハイパーパラメータチューニングの必要性に悩まされることが多い。
本研究では,ロボットタスクの分散解法であるADMM-DDPのハイパーパラメータを,最適化性能に応じて解時間で動的に調整するディープ・アンフォールディング・フレームワークであるディープ・コーディネータを提案する。
我々のアーキテクチャは、最適化状態を次のハイパーパラメータにマッピングするレイヤ間の学習可能な機能を備えたニューラルネットワークに、一定の数のADMM-DDPイテレーションをアンロールすることで構成されている。
我々の知る限り、Deep Coordinatorは、非凸オプティマイザのペナルティパラメータを解決時に適応する最初のディープアンフォールディングフレームワークである。
車両や四輪車によるシミュレーションでは、Deep Coordinatorは従来の解法よりも6.18-9.44倍速い品質の軌道を製造している。
さらに、Deep Coordinatorは、トレーニング対象の最大8倍のシステムにデプロイする際のパフォーマンス上のメリットも維持する。
関連論文リスト
- S$^3$LDBO: A Snapshot Single-Loop Algorithm for Decentralized Bilevel Optimization [19.171046927785333]
Snapshot-SLDBOは、効率的なシングルループ分散バイレベル最適化アルゴリズムである。
本論文では,Snapshot-SLDBOが競合学習性能を維持しつつ,計算効率を向上させることを示す。
論文 参考訳(メタデータ) (2026-05-29T13:44:46Z) - An End-to-End Deep Reinforcement Learning Approach for Solving the Traveling Salesman Problem with Drones [12.385878815004283]
本研究では、ドローンによるトラベリングセールスマン問題(TSP-D)を解決するための階層的アクター・クリティカル深部強化学習フレームワークを提案する。
アーキテクチャは、Transformerにインスパイアされたエンコーダと、効率の良いMinimal Gated Unitデコーダの2つの主要な計算で構成されている。
フレームワーク全体が非同期のアドバンテージアクター-クリティカルパラダイム内で動作します。
論文 参考訳(メタデータ) (2025-11-07T14:26:29Z) - A Unified Model for Multi-Task Drone Routing in Post-Disaster Road Assessment [14.07560120879767]
災害後の道路評価(PDRA)は緊急対応に不可欠であり、インフラ条件の迅速な評価を可能にする。
ドローンはPDRAに柔軟で効果的なツールを提供するが、大規模なネットワークでそれらをルーティングすることは依然として難しい。
本研究は,PDRAの8つの変種に同時に対応可能な,ドローンルーティングのための統一モデル(UM)を提案する。
論文 参考訳(メタデータ) (2025-10-24T14:48:57Z) - Learning to Coordinate: Distributed Meta-Trajectory Optimization Via Differentiable ADMM-DDP [4.880846795915428]
多様なタスクやエージェント構成に適応するために,L2C(Learning to Coordinate)を提案する。
L2CはADMM-DDPパイプラインを通じてエンドツーエンドを分散的に区別する。
最先端の手法よりも高速な勾配計算を実現する。
論文 参考訳(メタデータ) (2025-09-01T17:17:05Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - An Efficient Learning-based Solver Comparable to Metaheuristics for the
Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。
まず,方向対応型注意モデル(DaAM)を提案する。
第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文 参考訳(メタデータ) (2024-03-11T02:17:42Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Phase Retrieval using Expectation Consistent Signal Recovery Algorithm
based on Hypernetwork [73.94896986868146]
位相検索は現代の計算イメージングシステムにおいて重要な要素である。
近年のディープラーニングの進歩は、堅牢で高速なPRの新たな可能性を開いた。
我々は、既存の制限を克服するために、深層展開のための新しいフレームワークを開発する。
論文 参考訳(メタデータ) (2021-01-12T08:36:23Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。