論文の概要: Parametrized Multi-Agent Routing via Deep Attention Models
- arxiv url: http://arxiv.org/abs/2507.22338v1
- Date: Wed, 30 Jul 2025 02:46:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:17.931561
- Title: Parametrized Multi-Agent Routing via Deep Attention Models
- Title(参考訳): 深部注意モデルによるパラメタライズドマルチエージェントルーティング
- Authors: Salar Basiri, Dhananjay Tiwari, Srinivasa M. Salapaka,
- Abstract要約: パラメタライズドシーケンシャル意思決定のためのスケーラブルなディープラーニングフレームワーク(ParaSDM)を提案する。
この設定の重要なサブクラスは、複数のエージェントシステムが最適なルートと位置を同時に決定する必要がある施設と場所(FLPO)である。
これを解決するために、最大エントロピー原理(MEP)と、最短経路ネットワーク(SPN)と呼ばれるニューラルポリシーモデルを統合する。
- 参考スコア(独自算出の注目度): 1.0377683220196872
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a scalable deep learning framework for parametrized sequential decision-making (ParaSDM), where multiple agents jointly optimize discrete action policies and shared continuous parameters. A key subclass of this setting arises in Facility-Location and Path Optimization (FLPO), where multi-agent systems must simultaneously determine optimal routes and facility locations, aiming to minimize the cumulative transportation cost within the network. FLPO problems are NP-hard due to their mixed discrete-continuous structure and highly non-convex objective. To address this, we integrate the Maximum Entropy Principle (MEP) with a neural policy model called the Shortest Path Network (SPN)-a permutation-invariant encoder-decoder that approximates the MEP solution while enabling efficient gradient-based optimization over shared parameters. The SPN achieves up to 100$\times$ speedup in policy inference and gradient computation compared to MEP baselines, with an average optimality gap of approximately 6% across a wide range of problem sizes. Our FLPO approach yields over 10$\times$ lower cost than metaheuristic baselines while running significantly faster, and matches Gurobi's optimal cost with annealing at a 1500$\times$ speedup-establishing a new state of the art for ParaSDM problems. These results highlight the power of structured deep models for solving large-scale mixed-integer optimization tasks.
- Abstract(参考訳): 並列化シーケンシャル意思決定(ParaSDM)のためのスケーラブルなディープラーニングフレームワークを提案し、複数のエージェントが協調して個別アクションポリシーと共有連続パラメータを最適化する。
この設定の重要なサブクラスは、ネットワーク内の累積輸送コストを最小限に抑えるために、複数のエージェントシステムが最適なルートと施設の位置を同時に決定する必要がある施設配置と経路最適化(FLPO)である。
FLPO問題は、その混合した離散連続構造と非常に非凸目的のためにNPハードである。
これを解決するために、最大エントロピー原理(MEP)と、最短パスネットワーク(SPN)と呼ばれるニューラルポリシーモデルを統合する。
SPNは、MEPベースラインと比較して、ポリシー推論と勾配計算の100$\times$スピードアップを達成し、幅広い問題サイズの平均最適性ギャップは約6%である。
我々のFLPOアプローチはメタヒューリスティックベースラインよりも10$\times$コストをはるかに高速に実行し、Gurobiの最適コストと1500$\times$アニーリングとを一致させ、ParaSDM問題に対する新しい最先端技術を確立する。
これらの結果は、大規模混合整数最適化タスクを解くための構造化深度モデルのパワーを強調している。
関連論文リスト
- Beamforming and Resource Allocation for Delay Minimization in RIS-Assisted OFDM Systems [38.71413228444903]
本稿では、ダウンリンク再構成可能なインテリジェントサーフェス(RIS)支援OFDMシステムにおけるビームフォーミングと資源配分の問題について検討する。
混合作用空間を効果的に処理し, 状態空間次元を低減するために, ハイブリッド深部強化学習(DRL)手法を提案する。
提案アルゴリズムは, 平均遅延を著しく低減し, 資源配分効率を向上し, システムの堅牢性と公平性を向上する。
論文 参考訳(メタデータ) (2025-06-04T05:33:33Z) - A RankNet-Inspired Surrogate-Assisted Hybrid Metaheuristic for Expensive Coverage Optimization [5.757318591302855]
大規模カバレッジ最適化タスクを処理するために,RangeNetによるSurrogate支援ハイブリッドメタヒューリスティックを提案する。
我々のアルゴリズムは、EMVOPの最先端アルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2025-01-13T14:49:05Z) - Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - Federated Multi-Level Optimization over Decentralized Networks [55.776919718214224]
エージェントが隣人としか通信できないネットワーク上での分散マルチレベル最適化の問題について検討する。
ネットワーク化されたエージェントが1つの時間スケールで異なるレベルの最適化問題を解くことができる新しいゴシップに基づく分散マルチレベル最適化アルゴリズムを提案する。
提案アルゴリズムは, ネットワークサイズと線形にスケーリングし, 各種アプリケーション上での最先端性能を示す。
論文 参考訳(メタデータ) (2023-10-10T00:21:10Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Balancing the trade-off between cost and reliability for wireless sensor
networks: a multi-objective optimized deployment method [4.031433260365659]
実用無線センサネットワーク(WSN)の最適配置法を提案する。
我々は競合多目的最適化アルゴリズム(CMOMPA)として知られる新しい多目的最適化アルゴリズムを開発した。
その結果、最適化されたデプロイメントは、デプロイメントコスト、感度信頼性、ネットワーク信頼性のトレードオフのバランスをとることができることがわかった。
論文 参考訳(メタデータ) (2022-07-19T05:53:55Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。