論文の概要: General sum stochastic games with networked information flows
- arxiv url: http://arxiv.org/abs/2205.02760v1
- Date: Thu, 5 May 2022 16:33:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-06 15:18:11.274449
- Title: General sum stochastic games with networked information flows
- Title(参考訳): ネットワーク情報の流れをもつ一般和確率ゲーム
- Authors: Sarah H.Q. Li and Lillian J. Ratliff and Peeyush Kumar
- Abstract要約: 我々は、サプライチェーン管理、疫病、ソーシャルネットワークに共通する3つの重要な特徴に対処するゲームモデルを定式化する。
これらの特徴は、深層学習に基づくマルチエージェント強化学習(MARL)アルゴリズムによって得られるブラックボックスアプローチに重大な課題をもたらす。
異なるMARLパラダイムの結果に対する情報可用性の影響を実証的に検討する。
- 参考スコア(独自算出の注目度): 11.856844095086302
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inspired by applications such as supply chain management, epidemics, and
social networks, we formulate a stochastic game model that addresses three key
features common across these domains: 1) network-structured player
interactions, 2) pair-wise mixed cooperation and competition among players, and
3) limited global information toward individual decision-making. In
combination, these features pose significant challenges for black box
approaches taken by deep learning-based multi-agent reinforcement learning
(MARL) algorithms and deserve more detailed analysis. We formulate a networked
stochastic game with pair-wise general sum objectives and asymmetrical
information structure, and empirically explore the effects of information
availability on the outcomes of different MARL paradigms such as individual
learning and centralized learning decentralized execution.
- Abstract(参考訳): サプライチェーン管理、流行、ソーシャルネットワークといったアプリケーションから着想を得た私たちは、これらのドメインに共通する3つの重要な特徴に対処する確率ゲームモデルを定式化します。
1)ネットワーク構造型プレーヤーインタラクション
2対の混合協力と競技者間の競争、及び
3) 個人の意思決定に限定したグローバル情報。
これらの特徴が組み合わさって、深層学習に基づくマルチエージェント強化学習(MARL)アルゴリズムによって得られるブラックボックスアプローチに重大な課題が生じる。
ペアワイズ汎用和目標と非対称情報構造を持つネットワーク化された確率ゲームを作成し,個別学習や集中学習分散実行といった異なるマルルパラダイムの結果に対する情報可用性の影響を実証的に検討する。
関連論文リスト
- Distributed Continual Learning [12.18012293738896]
本稿では,分散連続学習の本質的側面を捉える数学的枠組みを提案する。
データインスタンス、完全なモデルパラメータ、モジュール化された(部分的な)モデルパラメータです。
タスクが複雑になるにつれて、データを共有するよりも、パラメータを共有する方が効率的です。
論文 参考訳(メタデータ) (2024-05-23T21:24:26Z) - Collaborative Information Dissemination with Graph-based Multi-Agent
Reinforcement Learning [2.9904113489777826]
本稿では,効率的な情報伝達のためのマルチエージェント強化学習(MARL)手法を提案する。
本稿では,各エージェントが個別にメッセージ転送を決定するための情報発信のための部分観測可能なゲーム(POSG)を提案する。
実験の結果,既存の手法よりも訓練済みの方針が優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-25T21:30:16Z) - Bidirectional Contrastive Split Learning for Visual Question Answering [6.135215040323833]
マルチモーダルデータに基づく視覚質問応答(VQA)は、ホームロボットや診断などの現実的な応用を促進する。
ひとつの課題は、さまざまなクライアントモデルのための堅牢な分散学習フレームワークを開発することです。
本稿では,分散化されたクライアントのデータ分散全体に対して,グローバルなマルチモーダルモデルをトレーニングするための双方向コントラスト分割学習(Bidirectional Contrastive Split Learning, BiCSL)を提案する。
論文 参考訳(メタデータ) (2022-08-24T11:01:47Z) - Competing Mutual Information Constraints with Stochastic
Competition-based Activations for Learning Diversified Representations [5.981521556433909]
本研究は,多角化表現の学習における長年の課題に対処することを目的としている。
情報理論の議論と競争に基づくアクティベーションを組み合わせる。
実験的に示すように、結果として得られるネットワークは、重要な離散表現学習能力をもたらす。
論文 参考訳(メタデータ) (2022-01-10T20:12:13Z) - Exploring Neural Models for Query-Focused Summarization [74.41256438059256]
クエリ中心の要約(QFS)に対するニューラルネットワークの体系的な探索を行う。
本稿では,QMSumデータセットの最先端性能を最大3.38ROUGE-1,3.72ROUGE-2,3.28ROUGE-Lのマージンで達成する2つのモデル拡張を提案する。
論文 参考訳(メタデータ) (2021-12-14T18:33:29Z) - A Cyber Threat Intelligence Sharing Scheme based on Federated Learning
for Network Intrusion Detection [3.5557219875516655]
プライバシの懸念とデータセットの普遍的なフォーマットの欠如に対処するために,協調学習方式を提案する。
提案したフレームワークにより、複数の組織が、堅牢なMLベースのネットワーク侵入検知システムの設計、トレーニング、評価に参加することができる。
論文 参考訳(メタデータ) (2021-11-04T12:06:34Z) - Multimodal Clustering Networks for Self-supervised Learning from
Unlabeled Videos [69.61522804742427]
本稿では,共通のマルチモーダル埋め込み空間を学習する自己監督型トレーニングフレームワークを提案する。
インスタンスレベルのコントラスト学習の概念をマルチモーダルクラスタリングステップで拡張し,モダリティ間の意味的類似性を捉える。
結果として得られる埋め込みスペースは、見えないデータセットや異なるドメインからでも、すべてのモダリティにわたるサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2021-04-26T15:55:01Z) - CoADNet: Collaborative Aggregation-and-Distribution Networks for
Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。
課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。
我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文 参考訳(メタデータ) (2020-11-10T04:28:11Z) - A game-theoretic analysis of networked system control for common-pool
resource management using multi-agent reinforcement learning [54.55119659523629]
マルチエージェント強化学習は近年,ネットワーク型システム制御へのアプローチとして大きな可能性を秘めている。
共通プールの資源は耕作可能な土地、淡水、湿地、野生生物、魚類資源、森林、大気である。
論文 参考訳(メタデータ) (2020-10-15T14:12:26Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z) - Unpaired Multi-modal Segmentation via Knowledge Distillation [77.39798870702174]
本稿では,不対向画像分割のための新しい学習手法を提案する。
提案手法では,CTおよびMRI間での畳み込みカーネルの共有により,ネットワークパラメータを多用する。
我々は2つの多クラスセグメンテーション問題に対するアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2020-01-06T20:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。