論文の概要: Fair-GNE : Generalized Nash Equilibrium-Seeking Fairness in Multiagent Healthcare Automation
- arxiv url: http://arxiv.org/abs/2511.14135v1
- Date: Tue, 18 Nov 2025 04:48:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.938808
- Title: Fair-GNE : Generalized Nash Equilibrium-Seeking Fairness in Multiagent Healthcare Automation
- Title(参考訳): Fair-GNE : マルチエージェント医療自動化における一般化ナッシュ平衡探索フェアネス
- Authors: Promise Ekpo, Saesha Agarwal, Felix Grimm, Lekan Molu, Angelique Taylor,
- Abstract要約: 既存のマルチエージェント強化学習は、ポストホックオーケストレーションを通じて報酬を形作ることによって、スティアフェアネスにアプローチする。
我々は、自己関心のある意思決定者間で学習可能な最適化スキームによって、この欠点に対処する。
本研究は, 大規模マルチエージェント学習型医療システムにおける定式化, 評価指標, 平衡探索のイノベーションについて報告する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enforcing a fair workload allocation among multiple agents tasked to achieve an objective in learning enabled demand side healthcare worker settings is crucial for consistent and reliable performance at runtime. Existing multi-agent reinforcement learning (MARL) approaches steer fairness by shaping reward through post hoc orchestrations, leaving no certifiable self-enforceable fairness that is immutable by individual agents at runtime. Contextualized within a setting where each agent shares resources with others, we address this shortcoming with a learning enabled optimization scheme among self-interested decision makers whose individual actions affect those of other agents. This extends the problem to a generalized Nash equilibrium (GNE) game-theoretic framework where we steer group policy to a safe and locally efficient equilibrium, so that no agent can improve its utility function by unilaterally changing its decisions. Fair-GNE models MARL as a constrained generalized Nash equilibrium-seeking (GNE) game, prescribing an ideal equitable collective equilibrium within the problem's natural fabric. Our hypothesis is rigorously evaluated in our custom-designed high-fidelity resuscitation simulator. Across all our numerical experiments, Fair-GNE achieves significant improvement in workload balance over fixed-penalty baselines (0.89 vs.\ 0.33 JFI, $p < 0.01$) while maintaining 86\% task success, demonstrating statistically significant fairness gains through adaptive constraint enforcement. Our results communicate our formulations, evaluation metrics, and equilibrium-seeking innovations in large multi-agent learning-based healthcare systems with clarity and principled fairness enforcement.
- Abstract(参考訳): 要求サイドの医療従事者設定を学習する目的を達成するために、複数のエージェント間で公平なワークロード割り当てを実施することは、実行時の一貫性と信頼性を備えたパフォーマンスに不可欠である。
既存のマルチエージェント強化学習(MARL)は、ポストホックオーケストレーションを通じて報酬を形作り、実行時に個々のエージェントによって不変である証明可能な自己強化可能な公正さを残さず、ステアフェアネスにアプローチする。
各エージェントがリソースを他のエージェントと共有する環境でコンテキスト化され、個々のアクションが他のエージェントに影響を及ぼす自己関心のある意思決定者の間で学習可能な最適化スキームによって、この欠点に対処する。
この問題を一般化されたナッシュ均衡(GNE)ゲーム理論の枠組みに拡張し、グループポリシーを安全かつ局所的に効率的な均衡に操り、一方的に決定を変更すれば、どのエージェントもそのユーティリティ機能を改善することができない。
Fair-GNE は、制約付き一般化されたナッシュ均衡探索(GNE)ゲームとして MARL をモデル化し、問題の自然な布地内での理想的な同値な集合平衡を規定している。
我々の仮説は、我々のカスタム設計した高忠実度蘇生シミュレータで厳格に評価されている。
全数値実験で、Fair-GNEは固定費用ベースライン(0.89対0.89)よりもワークロードバランスが大幅に向上した。
0.33 JFI, $p < 0.01$) であり、86 % のタスク成功を維持しながら、適応的制約執行による統計的に有意な公正性の向上を示す。
本研究は, 大規模マルチエージェント学習型医療システムにおける定式化, 評価指標, 平衡探索のイノベーションを, 明瞭さと原理的公正化を両立させるものである。
関連論文リスト
- A General Incentives-Based Framework for Fairness in Multi-agent Resource Allocation [4.930376365020355]
GIFF(General Incentives-based Framework for Fairness)を紹介する。
GIFFは、標準値関数から公平な意思決定を推測する、公平なマルチエージェントリソース割り当てのための新しいアプローチである。
論文 参考訳(メタデータ) (2025-10-30T17:37:51Z) - Skill-Aligned Fairness in Multi-Agent Learning for Collaboration in Healthcare [1.7466032719896134]
医療において、均等なタスク割り当ては、高度に熟練したエージェントの燃え尽きや過剰使用を防ぐために、ワークロードのバランスや専門知識の調整を必要とする。
作業負荷バランスとスキルタスクアライメントの両目的としてフェアネスを定義するフレームワークであるFairSkillMARLを提案する。
MARLHospitalは、チーム構成やエネルギー制約が公正性に与える影響をモデル化するための、カスタマイズ可能な医療インスピレーション付き環境である。
論文 参考訳(メタデータ) (2025-08-26T06:19:33Z) - From Debate to Equilibrium: Belief-Driven Multi-Agent LLM Reasoning via Bayesian Nash Equilibrium [52.28048367430481]
マルチエージェントフレームワークは、大規模言語モデル(LLM)の推論能力を高めることができるが、通常は計算コストと収束保証が欠如している。
我々は、不完全情報ゲームとしてマルチLLMコーディネーションをリキャストし、ベイズナッシュ均衡(BNE)を求める。
我々は、分散推論と集中的な最終出力を結合する階層的強化学習パラダイムである、Nash Equilibrium (ECON)による効率的なコーディネーションを導入する。
論文 参考訳(メタデータ) (2025-06-09T23:49:14Z) - Fairness Aware Reinforcement Learning via Proximal Policy Optimization [9.676752763382476]
本稿では, フェアネス定義から派生したペナルティ項を持つPPOにおけるフェアネスについて述べる。
アレルパシー・ハーベスト (Allelopathic Harvest) は, 資源収集に焦点を当てた協調的かつ競争的なMASであり, 病院シミュレーションの病院シムである。
論文 参考訳(メタデータ) (2025-02-06T10:45:55Z) - Game-Theoretical Perspectives on Active Equilibria: A Preferred Solution
Concept over Nash Equilibria [61.093297204685264]
マルチエージェント強化学習における効果的なアプローチは,エージェントの学習プロセスを検討し,今後の政策に影響を与えることである。
この新たな解の概念は、ナッシュ均衡のような標準解の概念が活性平衡の特別な場合である、という一般的なものである。
我々は,ゲーム理論の観点から,ナッシュ平衡が知られている実例を綿密に研究することにより,アクティブ平衡を解析する。
論文 参考訳(メタデータ) (2022-10-28T14:45:39Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Monotonic Improvement Guarantees under Non-stationarity for
Decentralized PPO [66.5384483339413]
我々は,MARL(Multi-Agent Reinforcement Learning)における分散政策の最適化のための新しい単調改善保証を提案する。
本研究では,訓練中のエージェント数に基づいて,独立した比率を限定することにより,信頼領域の制約を原則的に効果的に実施可能であることを示す。
論文 参考訳(メタデータ) (2022-01-31T20:39:48Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z) - Calibration of Shared Equilibria in General Sum Partially Observable
Markov Games [15.572157454411533]
我々は、異なるタイプのエージェントが単一のポリシーネットワークを共有する、一般的な可観測マルコフゲームを考える。
本稿は,そのようなエージェントが到達した平衡を形式的に理解すること,および,そのような平衡の創発的な現象を現実のターゲットに合わせることを目的としている。
論文 参考訳(メタデータ) (2020-06-23T15:14:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。