論文の概要: Coordinating Multiagent Industrial Symbiosis
- arxiv url: http://arxiv.org/abs/2006.01784v1
- Date: Tue, 2 Jun 2020 17:05:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 01:06:12.858304
- Title: Coordinating Multiagent Industrial Symbiosis
- Title(参考訳): マルチエージェント産業共生のコーディネート
- Authors: Vahid Yazdanpanah, Devrim Murat Yazan, W. Henk M. Zijm
- Abstract要約: 我々は,産業共生ネットワーク(ISN)と呼ばれる協調的な産業実践のクラスを協調ゲームとしてコーディネートするための,正式なマルチエージェントフレームワークを提案する。
ISNの特性は、標準的な公正と安定した利益配分手法の適用性に繋がる可能性がある。
我々は、ISNゲームと組み合わせた調整手段として規制と規範的社会経済政策を考える。
- 参考スコア(独自算出の注目度): 3.3517146652431378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a formal multiagent framework for coordinating a class of
collaborative industrial practices called Industrial Symbiotic Networks (ISNs)
as cooperative games. The game-theoretic formulation of ISNs enables systematic
reasoning about what we call the ISN implementation problem. Specifically, the
characteristics of ISNs may lead to the inapplicability of standard fair and
stable benefit allocation methods. Inspired by realistic ISN scenarios and
following the literature on normative multiagent systems, we consider
regulations and normative socio-economic policies as coordination instruments
that in combination with ISN games resolve the situation. In this multiagent
system, employing Marginal Contribution Nets (MC-Nets) as rule-based
cooperative game representations foster the combination of regulations and ISN
games with no loss in expressiveness. We develop algorithmic methods for
generating regulations that ensure the implementability of ISNs and as a policy
support, present the policy requirements that guarantee the implementability of
all the desired ISNs in a balanced-budget way.
- Abstract(参考訳): 我々は,産業共生ネットワーク(ISN)と呼ばれる協調的な産業実践のクラスを協調ゲームとしてコーディネートするための,正式なマルチエージェントフレームワークを提案する。
ISNのゲーム理論の定式化は、我々がISN実装問題と呼ぶものについての体系的な推論を可能にする。
特に、ISNの特性は、標準公正と安定した利益配分手法の適用性に繋がる可能性がある。
現実的isシナリオに触発され、規範的マルチエージェントシステムに関する文献に従い、規則と規範的社会経済政策を、isゲームと組み合わせて状況を解決できる協調手段として考える。
このマルチエージェントシステムでは,ルールベースの協調ゲーム表現としてMarginal Contribution Nets (MC-Nets) を用いることで,表現性を損なうことなく,規則とISNゲームの組み合わせを促進する。
我々は,isの実施可能性を確保するための規則生成のためのアルゴリズム的手法を開発し,政策支援として,望むすべてのisの実装性を保証する政策要件をバランスのとれたバジェット方式で提示する。
関連論文リスト
- Intelligent Hybrid Resource Allocation in MEC-assisted RAN Slicing Network [72.2456220035229]
我々は,協調型MEC支援RANスライシングシステムにおける異種サービス要求に対するSSRの最大化を目指す。
最適ハイブリッドRAポリシーをインテリジェントに学習するためのRGRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-02T01:36:13Z) - Policy Optimization finds Nash Equilibrium in Regularized General-Sum LQ Games [5.268554895844062]
本稿では,ジェネラルサム$N$エージェントゲームのナッシュ平衡に対する相対エントロピー正規化の導入の影響について検討する。
ゲーム内のNEの特異性に対して、エントロピー正則化の妥当性に基づいて十分な条件を導出する。
エントロピー正規化が不十分なシナリオでは,ゲーム内での$epsilon$-NEの達成を促進する$delta$-augmentation手法を提案する。
論文 参考訳(メタデータ) (2024-03-25T04:45:28Z) - On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非凹面ゲームはゲーム理論と最適化に重大な課題をもたらす。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
また,オンライングラディエントDescentは,非自明な状況下で効率よく$Phi$-equilibriaを近似できることを示した。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - Federated Contextual Cascading Bandits with Asynchronous Communication
and Heterogeneous Users [95.77678166036561]
繊細な通信プロトコルを用いたUPB型アルゴリズムを提案する。
同期フレームワークで達成されたものと同等のサブ線形後悔境界を与えます。
合成および実世界のデータセットに関する実証評価は、後悔と通信コストの観点から、我々のアルゴリズムの優れた性能を検証する。
論文 参考訳(メタデータ) (2024-02-26T05:31:14Z) - Context-Aware Bayesian Network Actor-Critic Methods for Cooperative
Multi-Agent Reinforcement Learning [7.784991832712813]
本稿では, エージェントの行動選択の相関関係を, 共同政策に導入するベイズネットワークを提案する。
本研究では,コンテキスト認識型ベイズ型ネットワークポリシを学習するための実用的なアルゴリズムを開発した。
MARLベンチマークの実証結果は,我々のアプローチの利点を示している。
論文 参考訳(メタデータ) (2023-06-02T21:22:27Z) - IQ-Flow: Mechanism Design for Inducing Cooperative Behavior to
Self-Interested Agents in Sequential Social Dilemmas [0.0]
Incentive Q-Flow (IQ-Flow) アルゴリズムを提案する。
自己関心のあるエージェントのインセンティブを学習する既存の方法とは異なり、IQ-Flowはエージェントのポリシーに関する仮定を一切行わない。
Escape Room や 2-Player のクリーンアップ環境において,IQ-Flow が最先端のインセンティブ設計アルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-28T14:44:29Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Symbolic Distillation for Learned TCP Congestion Control [70.27367981153299]
TCP渋滞制御は、深層強化学習(RL)アプローチで大きな成功を収めた。
ブラックボックスポリシーは解釈可能性と信頼性に欠けており、しばしば従来のTCPデータパスの外で運用する必要がある。
本稿では,まず深部RLエージェントを訓練し,次にNNポリシーをホワイトボックスの軽量なルールに蒸留する,両世界の長所を達成するための新しい2段階のソリューションを提案する。
論文 参考訳(メタデータ) (2022-10-24T00:58:16Z) - Normative Disagreement as a Challenge for Cooperative AI [56.34005280792013]
典型的な協調誘導学習アルゴリズムは、問題の解決に協力することができないと論じる。
我々は,ノルム適応政策のクラスを開発し,これらが協調性を著しく向上させることを示す実験を行った。
論文 参考訳(メタデータ) (2021-11-27T11:37:42Z) - Calibration of Shared Equilibria in General Sum Partially Observable
Markov Games [15.572157454411533]
我々は、異なるタイプのエージェントが単一のポリシーネットワークを共有する、一般的な可観測マルコフゲームを考える。
本稿は,そのようなエージェントが到達した平衡を形式的に理解すること,および,そのような平衡の創発的な現象を現実のターゲットに合わせることを目的としている。
論文 参考訳(メタデータ) (2020-06-23T15:14:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。