論文の概要: DECAF: Learning to be Fair in Multi-agent Resource Allocation
- arxiv url: http://arxiv.org/abs/2502.04281v1
- Date: Thu, 06 Feb 2025 18:29:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:34:05.274497
- Title: DECAF: Learning to be Fair in Multi-agent Resource Allocation
- Title(参考訳): DECAF:マルチエージェントリソースアロケーションで公正になるための学習
- Authors: Ashwin Kumar, William Yeoh,
- Abstract要約: 本研究では,資源集中配置における公平かつ効率的な政策を学習するための手法を提案する。
提案手法は,マルチエージェントシステムにおける公平性のための新しい,汎用的なフレームワークにおいて,長期的公正性学習に適用される。
- 参考スコア(独自算出の注目度): 4.788163807490197
- License:
- Abstract: A wide variety of resource allocation problems operate under resource constraints that are managed by a central arbitrator, with agents who evaluate and communicate preferences over these resources. We formulate this broad class of problems as Distributed Evaluation, Centralized Allocation (DECA) problems and propose methods to learn fair and efficient policies in centralized resource allocation. Our methods are applied to learning long-term fairness in a novel and general framework for fairness in multi-agent systems. We show three different methods based on Double Deep Q-Learning: (1) A joint weighted optimization of fairness and utility, (2) a split optimization, learning two separate Q-estimators for utility and fairness, and (3) an online policy perturbation to guide existing black-box utility functions toward fair solutions. Our methods outperform existing fair MARL approaches on multiple resource allocation domains, even when evaluated using diverse fairness functions, and allow for flexible online trade-offs between utility and fairness.
- Abstract(参考訳): リソース割り当て問題は、中央の仲裁業者によって管理されるリソース制約の下で動作し、これらのリソースに対する好みを評価し、伝達するエージェントである。
本稿では、分散評価、集中割当(DECA)問題としてこの幅広い問題を定式化し、集中資源割当における公平かつ効率的な政策を学習するための方法を提案する。
提案手法は,マルチエージェントシステムにおける公平性のための新しい,汎用的なフレームワークにおいて,長期的公正性学習に適用される。
1) フェアネスとユーティリティの重み付けによる最適化,(2) 分割最適化,2) ユーティリティとフェアネスのための2つの個別Q推定器の学習,(3) 既存のブラックボックスユーティリティ機能をフェアソリューションに導くためのオンラインポリシー摂動,の3つの方法を示す。
提案手法は,多種多様な公平度関数を用いて評価しても,複数の資源割り当て領域に対する既存の公平度アプローチよりも優れており,実用性と公正性の間のフレキシブルなオンライントレードオフを可能にする。
関連論文リスト
- Active Learning for Fair and Stable Online Allocations [6.23798328186465]
我々は、オンラインリソース割り当てプロセスの各エポックにおいて、エージェントの特定のサブセットからのフィードバックを検討する。
提案アルゴリズムは,様々な測度に対して,時系列のサブ線形な後悔境界を提供する。
我々は,効率的な意思決定には広範なフィードバックは必要とせず,様々な問題クラスに対して効率的な結果をもたらすことを示した。
論文 参考訳(メタデータ) (2024-06-20T23:23:23Z) - Semi-Supervised Learning Approach for Efficient Resource Allocation with Network Slicing in O-RAN [5.1435595246496595]
本稿では資源配分問題に対する革新的なアプローチを紹介する。
Open Radio Access Network (O-RAN) におけるネットワークスライシングとリソース割り当てのために、複数の独立したx-appplications (xAPPs) を協調することを目的としている。
論文 参考訳(メタデータ) (2024-01-16T22:23:27Z) - Achieving Fairness in Multi-Agent Markov Decision Processes Using
Reinforcement Learning [30.605881670761853]
有限水平エピソードMDPにおける公平性を実現するための強化学習手法を提案する。
このようなアプローチは、エピソード数の観点から、サブ線形後悔を実現することを示す。
論文 参考訳(メタデータ) (2023-06-01T03:43:53Z) - How Robust is Your Fairness? Evaluating and Sustaining Fairness under
Unseen Distribution Shifts [107.72786199113183]
CUMA(CUrvature Matching)と呼ばれる新しいフェアネス学習手法を提案する。
CUMAは、未知の分布シフトを持つ未知の領域に一般化可能な頑健な公正性を達成する。
提案手法を3つの人気フェアネスデータセットで評価する。
論文 参考訳(メタデータ) (2022-07-04T02:37:50Z) - Multi-Fair Pareto Boosting [7.824964622317634]
マルチ属性)保護グループとインスタンスのクラスメンバシップの両方を考慮しながら、不公平度を測定する新しい公平性概念であるMulti-Max Mistreatment(MMM)を紹介します。
本研究では,分散更新とポストトレーニングにおいて,マルチフェアネス処理を取り入れたブースティング手法を用いて問題を解決する。
論文 参考訳(メタデータ) (2021-04-27T16:37:35Z) - Learning Fair Policies in Decentralized Cooperative Multi-Agent
Reinforcement Learning [12.215625537879108]
深い)協調的マルチエージェント強化学習(MARL)における公正な政策の学習の問題を検討する。
本稿では,フェアネスの2つの側面を考慮した2つのサブネットワークからなるニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-17T07:17:36Z) - Toward Multiple Federated Learning Services Resource Sharing in Mobile
Edge Networks [88.15736037284408]
本稿では,マルチアクセスエッジコンピューティングサーバにおいて,複数のフェデレーション付き学習サービスの新たなモデルについて検討する。
共同資源最適化とハイパーラーニング率制御の問題,すなわちMS-FEDLを提案する。
シミュレーションの結果,提案アルゴリズムの収束性能を実証した。
論文 参考訳(メタデータ) (2020-11-25T01:29:41Z) - Towards Fair Knowledge Transfer for Imbalanced Domain Adaptation [61.317911756566126]
本研究では,不均衡なドメイン間学習における公平性問題に対処するTowards Fair Knowledge Transferフレームワークを提案する。
具体的には、新規なクロスドメインミックスアップ生成を利用して、ターゲット情報でマイノリティソースセットを増強し、公正性を高める。
本モデルでは,2つのベンチマークで全体の精度を20%以上向上させる。
論文 参考訳(メタデータ) (2020-10-23T06:29:09Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z) - Universal Source-Free Domain Adaptation [57.37520645827318]
ドメイン適応のための新しい2段階学習プロセスを提案する。
Procurementの段階では、今後のカテゴリギャップやドメインシフトに関する事前知識を前提とせず、将来的なソースフリーデプロイメントのためのモデルの提供を目標としています。
Deploymentの段階では、幅広いカテゴリギャップをまたいで動作可能な統一適応アルゴリズムを設計することを目的としている。
論文 参考訳(メタデータ) (2020-04-09T07:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。