論文の概要: Learning Optimal Temperature Region for Solving Mixed Integer Functional
DCOPs
- arxiv url: http://arxiv.org/abs/2002.12001v2
- Date: Wed, 2 Sep 2020 06:17:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 09:08:21.300101
- Title: Learning Optimal Temperature Region for Solving Mixed Integer Functional
DCOPs
- Title(参考訳): 混合整数関数DCOPの解法における最適温度領域の学習
- Authors: Saaduddin Mahmud, Md. Mosaddek Khan, Moumita Choudhury, Long
Tran-Thanh and Nicholas R. Jennings
- Abstract要約: 分散制約最適化問題(DCOP)と機能DCOP(F-DCOP)を組み合わせる。
次に、DPSA(Distributed Parallel Simulated Annealing)という新しいアルゴリズムを提案する。
DPSAは, 現状の非現実的アルゴリズムよりも高い品質の解を, 対応する設定で生成することを示す。
- 参考スコア(独自算出の注目度): 26.16778095954815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distributed Constraint Optimization Problems (DCOPs) are an important
framework for modeling coordinated decision-making problems in multi-agent
systems with a set of discrete variables. Later works have extended DCOPs to
model problems with a set of continuous variables, named Functional DCOPs
(F-DCOPs). In this paper, we combine both of these frameworks into the Mixed
Integer Functional DCOP (MIF-DCOP) framework that can deal with problems
regardless of their variables' type. We then propose a novel algorithm $-$
Distributed Parallel Simulated Annealing (DPSA), where agents cooperatively
learn the optimal parameter configuration for the algorithm while also solving
the given problem using the learned knowledge. Finally, we empirically evaluate
our approach in DCOP, F-DCOP, and MIF-DCOP settings and show that DPSA produces
solutions of significantly better quality than the state-of-the-art non-exact
algorithms in their corresponding settings.
- Abstract(参考訳): 分散制約最適化問題(DCOP)は、離散変数の集合を持つマルチエージェントシステムにおいて、協調決定問題をモデル化するための重要なフレームワークである。
その後の研究では、関数型DCOP(F-DCOP)と呼ばれる連続変数の集合で問題をモデル化するためにDCOPを拡張した。
本稿では,これら2つのフレームワークをMIF-DCOP(Mixed Integer Functional DCOP)フレームワークに統合し,変数の型に関係なく問題に対処する。
次に、エージェントがアルゴリズムの最適パラメータ設定を協調的に学習し、学習知識を用いて与えられた問題を解く、新しいアルゴリズムである$-$Distributed Parallel Simulated Annealing (DPSA)を提案する。
最後に,本手法をDCOP,F-DCOP,MIF-DCOP設定で実証的に評価し,DPSAが対応する設定における最先端の非現実的アルゴリズムよりもはるかに優れた品質の解を生成することを示す。
関連論文リスト
- Sample-Efficient Multi-Agent RL: An Optimization Perspective [103.35353196535544]
一般関数近似に基づく汎用マルコフゲーム(MG)のためのマルチエージェント強化学習(MARL)について検討した。
汎用MGに対するマルチエージェントデカップリング係数(MADC)と呼ばれる新しい複雑性尺度を導入する。
我々のアルゴリズムは既存の研究に匹敵するサブリニアな後悔を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T01:39:04Z) - DIMES: A Differentiable Meta Solver for Combinatorial Optimization
Problems [41.57773395100222]
深部強化学習(DRL)モデルはNP-hard Combinatorial Optimization問題を解決する上で有望な結果を示している。
本稿では,DIMESという新しいアプローチを提案することによって,大規模最適化におけるスケーラビリティの課題に対処する。
コストのかかる自己回帰的復号法や離散解の反復的洗練に苦しむ従来のDRL法とは異なり、DIMESは候補解の基底分布をパラメータ化するためのコンパクトな連続空間を導入する。
DIMESは、トラベリングセールスマン問題や最大独立セット問題のための大規模なベンチマークデータセットにおいて、最近のDRLベースの手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-08T23:24:37Z) - On a class of geodesically convex optimization problems solved via
Euclidean MM methods [50.428784381385164]
ユークリッド凸化関数の違いは、統計学と機械学習の異なるタイプの問題の違いとして記述できることを示す。
最終的に、より広い範囲、より広い範囲の作業を支援するのです。
論文 参考訳(メタデータ) (2022-06-22T23:57:40Z) - Neural Stochastic Dual Dynamic Programming [99.80617899593526]
我々は、問題インスタンスを断片的線形値関数にマッピングすることを学ぶトレーニング可能なニューラルモデルを導入する。
$nu$-SDDPは、ソリューションの品質を犠牲にすることなく、問題解決コストを大幅に削減できる。
論文 参考訳(メタデータ) (2021-12-01T22:55:23Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Two-Stage Stochastic Optimization via Primal-Dual Decomposition and Deep
Unrolling [86.85697555068168]
2段階のアルゴリズム最適化は、様々な工学や科学的応用において重要な役割を果たす。
特に長期変数と短期変数が制約の中で結合されている場合、アルゴリズムは効率的ではない。
PDD-SSCAが既存のソリューションよりも優れたパフォーマンスを達成できることを示します。
論文 参考訳(メタデータ) (2021-05-05T03:36:00Z) - Ensemble Feature Extraction for Multi-Container Quality-Diversity
Algorithms [0.2741266294612775]
品質多様性アルゴリズムは多種多様な高性能なソリューションのコレクションを探索する。
MC-AURORA(Quality-Diversity approach)について述べる。
このアプローチは、単一表現アプローチによって生成されるソリューションよりも、より多様なソリューションを生成することを示す。
論文 参考訳(メタデータ) (2021-05-03T08:35:00Z) - A Particle Swarm Inspired Approach for Continuous Distributed Constraint
Optimization Problems [7.512486812178571]
連続DCOPは連続変数で問題を明示的にモデル化することができる。
C-DCOPを解くための最先端のアプローチは、面倒なメモリか計算オーバーヘッドのいずれかを経験する。
そこで我々は,Particle Swarm Optimization(PSO)にインスパイアされた新しいC-DCOPアルゴリズム,すなわちParticle Swarm Optimization Based C-DCOP(PCD)を提案する。
論文 参考訳(メタデータ) (2020-10-20T11:04:47Z) - Hybrid DCOP Solvers: Boosting Performance of Local Search Algorithms [0.6853165736531939]
本稿では,非対称分散制約最適化問題(DCOP)の解法を提案する。
DCOPソルバを高速な非イテレーティブなDCOPソルバで初期化する。
既存のDCOPソルバの開始条件の変更は,アルゴリズム収束時間を最大50%短縮するだけでなく,通信オーバーヘッドを低減し,解の質の向上につながることを示す。
論文 参考訳(メタデータ) (2020-09-04T15:17:24Z) - A Multi-Agent Primal-Dual Strategy for Composite Optimization over
Distributed Features [52.856801164425086]
目的関数を滑らかな局所関数と凸(おそらく非滑らか)結合関数の和とするマルチエージェント共有最適化問題について検討する。
論文 参考訳(メタデータ) (2020-06-15T19:40:24Z) - C-CoCoA: A Continuous Cooperative Constraint Approximation Algorithm to
Solve Functional DCOPs [4.404507236193031]
本稿では,協調制約近似(CoCoA)アルゴリズムに非線形最適化法を適用した。
提案アルゴリズムは,通信コストの低減と実行時間の短縮を犠牲にして,高品質なソリューションを提供することができる。
論文 参考訳(メタデータ) (2020-02-27T20:44:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。