Fugu-MT 論文翻訳(概要): Non-Linear Coordination Graphs

論文の概要: Non-Linear Coordination Graphs

arxiv url: http://arxiv.org/abs/2211.08404v1
Date: Wed, 26 Oct 2022 18:11:31 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-20 14:16:32.821830
Title: Non-Linear Coordination Graphs
Title（参考訳）: 非線形コーディネーショングラフ
Authors: Yipeng Kang, Tonghan Wang, Xiaoran Wu, Qianlan Yang, Chongjie Zhang
Abstract要約: 座標グラフ(CG)は、ペアのペイオフ関数を組み込んだ高次分解を表す。 CG値の分解を線形の場合を超えて拡張することにより、最初の非線形座標グラフを提案する。提案手法は,MACOのようなマルチエージェント協調タスクにおいて,優れた性能を実現することができる。
参考スコア（独自算出の注目度）: 22.29517436920317
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Value decomposition multi-agent reinforcement learning methods learn the global value function as a mixing of each agent's individual utility functions. Coordination graphs (CGs) represent a higher-order decomposition by incorporating pairwise payoff functions and thus is supposed to have a more powerful representational capacity. However, CGs decompose the global value function linearly over local value functions, severely limiting the complexity of the value function class that can be represented. In this paper, we propose the first non-linear coordination graph by extending CG value decomposition beyond the linear case. One major challenge is to conduct greedy action selections in this new function class to which commonly adopted DCOP algorithms are no longer applicable. We study how to solve this problem when mixing networks with LeakyReLU activation are used. An enumeration method with a global optimality guarantee is proposed and motivates an efficient iterative optimization method with a local optimality guarantee. We find that our method can achieve superior performance on challenging multi-agent coordination tasks like MACO.
Abstract（参考訳）: 値分解多エージェント強化学習法は,各エージェントの個々のユーティリティ関数の混合としてグローバル値関数を学習する。座標グラフ(CG)はペアのペイオフ関数を組み込むことで高次分解を表現するため、より強力な表現能力を持つと考えられる。しかし、CGは局所値関数に対して線形に大域値関数を分解し、表現できる値関数クラスの複雑さを著しく制限する。本稿では,CG値の分解を線形ケースを超えて拡張することにより,最初の非線形座標グラフを提案する。一つの大きな課題は、一般的に採用されているdcopアルゴリズムがもはや適用されない新しい関数クラスで欲張りなアクション選択を行うことである。我々は、LeakyReLUアクティベーションとネットワークを混合する際のこの問題の解法について検討する。大域的最適性保証付き列挙法を提案し、局所最適性保証付き効率的な反復最適化法を動機付ける。提案手法は,MACOのようなマルチエージェント協調タスクにおいて,優れた性能を実現することができる。

関連論文リスト

COPO: Consistency-Aware Policy Optimization [17.328515578426227]
強化学習は、複雑な問題解決タスクにおける大規模言語モデル(LLM)の推論能力を大幅に向上させた。近年、DeepSeek R1の導入により、ルールベースの報酬をコンピューティングの利点関数の低コストな代替手段として活用し、ポリシー最適化を導くことへの関心が高まっている。本稿では,結果整合性に基づくグローバルな報酬構造を導入する,整合性を考慮したポリシー最適化フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-06T07:05:18Z)
Recursive Reward Aggregation [51.552609126905885]
本稿では,報酬関数の変更を不要としたフレキシブルな行動アライメントのための代替手法を提案する。マルコフ決定過程(MDP)の代数的視点を導入することにより、ベルマン方程式が報酬の生成と集約から自然に現れることを示す。我々のアプローチは決定論的および決定論的設定の両方に適用され、価値に基づくアルゴリズムとアクター批判的アルゴリズムとシームレスに統合される。
論文参考訳（メタデータ） (2025-07-11T12:37:20Z)
Near-Optimal Online Learning for Multi-Agent Submodular Coordination: Tight Approximation and Communication Efficiency [52.60557300927007]
離散部分モジュラー問題を連続的に最適化するために,$textbfMA-OSMA$アルゴリズムを提案する。また、一様分布を混合することによりKLの発散を効果的に活用する、プロジェクションフリーな$textbfMA-OSEA$アルゴリズムも導入する。我々のアルゴリズムは最先端OSGアルゴリズムによって提供される$(frac11+c)$-approximationを大幅に改善する。
論文参考訳（メタデータ） (2025-02-07T15:57:56Z)
A Greedy Strategy for Graph Cut [95.2841574410968]
GGCと呼ばれるグラフカットの問題を解決するための欲求戦略を提案する。これは、各データサンプルがクラスタと見なされる状態から始まり、2つのクラスタを動的にマージする。 GGCはサンプル数に関してほぼ線形な計算複雑性を持つ。
論文参考訳（メタデータ） (2024-12-28T05:49:42Z)
Brain-inspired Chaotic Graph Backpropagation for Large-scale Combinatorial Optimization [3.97492577026225]
教師なし学習を伴うグラフニューラルネットワーク(GNN)は、効率的な時間複雑性で大規模最適化問題(COP)を解決することができる。しかし、現在の主流のバックプロパゲーションベースのトレーニングアルゴリズムは、ローカルなミニマに陥りがちである。カオスグラフバックプロパゲーション(CGBP)というカオス学習アルゴリズムを導入し,カオスだけではなく,高い効率でトレーニングを行う。
論文参考訳（メタデータ） (2024-12-13T05:00:57Z)
Enhancing GNNs Performance on Combinatorial Optimization by Recurrent Feature Update [0.09986418756990156]
本稿では,組合せ最適化(CO)問題を効率よく解くために,GNNのパワーを活用して,QRF-GNNと呼ぶ新しいアルゴリズムを提案する。 QUBO緩和による損失関数の最小化による教師なし学習に依存している。実験の結果、QRF-GNNは既存の学習ベースアプローチを大幅に上回り、最先端の手法に匹敵することがわかった。
論文参考訳（メタデータ） (2024-07-23T13:34:35Z)
Optimally Improving Cooperative Learning in a Social Setting [4.200480236342444]
個人所有の分類器を持つネットワークエージェントの集合を動的に更新する協調学習シナリオを考察する。本稿では,集合目的関数を最適化するための時間アルゴリズムを示し,平等目的関数の最適化がNPハードであることを示す。全てのアルゴリズムの性能は数学的解析によって保証され、合成データと実データの実験によって裏付けられている。
論文参考訳（メタデータ） (2024-05-31T14:07:33Z)
Rethinking and Accelerating Graph Condensation: A Training-Free Approach with Class Partition [56.26113670151363]
グラフ凝縮(Graph condensation)は、大きなグラフを小さいが情報的な凝縮グラフに置き換えるための、データ中心のソリューションである。既存のGCメソッドは複雑な最適化プロセスに悩まされており、過剰な計算資源を必要とする。我々は、CGC(Class-partitioned Graph Condensation)と呼ばれるトレーニング不要なGCフレームワークを提案する。 CGCはより効率的な凝縮プロセスで最先端の性能を達成する。
論文参考訳（メタデータ） (2024-05-22T14:57:09Z)
Practical First-Order Bayesian Optimization Algorithms [0.0]
本稿では,勾配GPからの情報を効率よく活用して,ゼロ勾配の潜在的な問合せ点を同定する,実用的なFOBOアルゴリズムのクラスを提案する。提案アルゴリズムの性能をいくつかのテスト関数で検証し,提案アルゴリズムが最先端のFOBOアルゴリズムより優れていることを示す。
論文参考訳（メタデータ） (2023-06-19T10:05:41Z)
Greedy based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning [64.05646120624287]
LVDとMVDの結合Q値関数を導出する。最適な整合性を確保するために、最適なノードは独自のSTNである必要がある。本手法は,様々なベンチマーク実験において,最先端のベースラインよりも優れた性能を示す。
論文参考訳（メタデータ） (2022-11-22T08:14:50Z)
Graph-adaptive Rectified Linear Unit for Graph Neural Networks [64.92221119723048]
グラフニューラルネットワーク(GNN)は、従来の畳み込みを非ユークリッドデータでの学習に拡張することで、目覚ましい成功を収めた。本稿では,周辺情報を利用した新しいパラメトリックアクティベーション機能であるグラフ適応整流線形ユニット(GRELU)を提案する。我々は,GNNのバックボーンと様々な下流タスクによって,プラグアンドプレイGRELU法が効率的かつ効果的であることを示す包括的実験を行った。
論文参考訳（メタデータ） (2022-02-13T10:54:59Z)
Self-Organized Polynomial-Time Coordination Graphs [21.02670428540549]
コーディネーショングラフは強化学習におけるモデルエージェント協調に対する有望なアプローチである。このパラダイムの課題の1つは、グラフベースの値分解のための最大値アクションの計算の複雑さである。本稿では,自己組織型多項式時間座標グラフ (SOP-CG) という新しい手法を提案する。
論文参考訳（メタデータ） (2021-12-07T07:42:40Z)
A Bi-Level Framework for Learning to Solve Combinatorial Optimization on Graphs [91.07247251502564]
本稿では,2つの世界の長所を結合するハイブリッドな手法を提案する。この手法では,グラフを最適化する上層学習手法とバイレベルフレームワークを開発する。このような二段階のアプローチは、元のハードCOでの学習を単純化し、モデルキャパシティの需要を効果的に軽減することができる。
論文参考訳（メタデータ） (2021-06-09T09:18:18Z)
Deep Reinforcement Learning of Graph Matching [63.469961545293756]
ノードとペアの制約下でのグラフマッチング(GM)は、最適化からコンピュータビジョンまでの領域におけるビルディングブロックである。 GMのための強化学習ソルバを提案する。 rgmはペアワイズグラフ間のノード対応を求める。本手法は,フロントエンドの特徴抽出と親和性関数学習に焦点をあてるという意味において,従来のディープグラフマッチングモデルと異なる。
論文参考訳（メタデータ） (2020-12-16T13:48:48Z)
A Multi-Agent Primal-Dual Strategy for Composite Optimization over Distributed Features [52.856801164425086]
目的関数を滑らかな局所関数と凸(おそらく非滑らか)結合関数の和とするマルチエージェント共有最適化問題について検討する。
論文参考訳（メタデータ） (2020-06-15T19:40:24Z)
Learning to be Global Optimizer [28.88646928299302]
いくつかのベンチマーク関数に対して最適なネットワークとエスケープ能力アルゴリズムを学習する。学習したアルゴリズムは、よく知られた古典最適化アルゴリズムよりも大幅に優れていることを示す。
論文参考訳（メタデータ） (2020-03-10T03:46:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。