論文の概要: EcoFair-CH-MARL: Scalable Constrained Hierarchical Multi-Agent RL with Real-Time Emission Budgets and Fairness Guarantees
- arxiv url: http://arxiv.org/abs/2603.14625v1
- Date: Sun, 15 Mar 2026 21:40:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.923208
- Title: EcoFair-CH-MARL: Scalable Constrained Hierarchical Multi-Agent RL with Real-Time Emission Budgets and Fairness Guarantees
- Title(参考訳): EcoFair-CH-MARL:リアルタイムエミッション予算と公正保証を備えたスケーラブル制約階層型マルチエージェントRL
- Authors: Saad Alqithami,
- Abstract要約: EcoFair-CH-MARLは制約付き階層型マルチエージェント強化学習フレームワークである。
i) 気象と需要の下で高い累積排出量を確実に束縛する原始的二元的予算層、(ii) 不均一艦隊間の最大コスト株式を強制する動的にスケジュールされた罰則を持つ公正な報酬トランスフォーマー、(iii) リアルタイム船舶制御から戦略的ルーティングを分離し、エージェントカウントの線形スケーリングを可能にする2段階の政策アーキテクチャである。
- 参考スコア(独自算出の注目度): 2.28438857884398
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Global decarbonisation targets and tightening market pressures demand maritime logistics solutions that are simultaneously efficient, sustainable, and equitable. We introduce EcoFair-CH-MARL, a constrained hierarchical multi-agent reinforcement learning framework that unifies three innovations: (i) a primal-dual budget layer that provably bounds cumulative emissions under stochastic weather and demand; (ii) a fairness-aware reward transformer with dynamically scheduled penalties that enforces max-min cost equity across heterogeneous fleets; and (iii) a two-tier policy architecture that decouples strategic routing from real-time vessel control, enabling linear scaling in agent count. New theoretical results establish O(\sqrt{T}) regret for both constraint violations and fairness loss. Experiments on a high-fidelity maritime digital twin (16 ports, 50 vessels) driven by automatic identification system traces, plus an energy-grid case study, show up to 15% lower emissions, 12% higher through-put, and a 45% fair-cost improvement over state-of-the-art hierarchical and constrained MARL baselines. In addition, EcoFair-CH-MARL achieves stronger equity (lower Gini and higher min-max welfare) than fairness-specific MARL baselines (e.g., SOTO, FEN), and its modular design is compatible with both policy- and value-based learners. EcoFair-CH-MARL therefore advances the feasibility of large-scale, regulation-compliant, and socially responsible multi-agent coordination in safety-critical domains.
- Abstract(参考訳): 世界的な脱炭目標と市場圧力の強化は、同時に効率的で持続可能で公平な海上物流ソリューションを必要としている。
制約付き階層型マルチエージェント強化学習フレームワークであるEcoFair-CH-MARLを紹介する。
一 確率的気象及び需要の下で累積排出を確実に拘束する原始二重予算層
二 不均質艦隊の最高コスト株式を強制する動的に計画された罰則を有する公正を意識した報酬トランスフォーマー
三 リアルタイムの船舶制御から戦略的ルーティングを分離し、エージェントカウントの線形スケーリングを可能にする二層政策アーキテクチャ。
新たな理論的結果は、制約違反と公正損失の両方をO(\sqrt{T})が後悔することを示す。
自動識別システムトレースにより駆動される高忠実な海上デジタル双生児(16港50船)とエネルギーグリッドケーススタディでは, 15%低出力, 12%高出力, 45%高コストMARLベースラインに対する公正な改善が見られた。
さらに、EcoFair-CH-MARLは、フェアネス固有のMARLベースライン(例えば、SOTO、FEN)よりも、より優れたエクイティ(より低いGiniとより低いmin-maxの福祉)を達成する。
EcoFair-CH-MARLは、安全クリティカルドメインにおける大規模で規制に準拠し、社会的に責任を負うマルチエージェント協調の実現可能性を高める。
関連論文リスト
- EcoGym: Evaluating LLMs for Long-Horizon Plan-and-Execute in Interactive Economies [61.267836443398124]
対話型経済における継続的計画・実行意思決定のためのベンチマークであるEcoGymを紹介する。
EcoGymは、透明性のある長期的なエージェント評価のためのオープンなテストベッドとしてリリースされ、現実的な経済環境下でのコントロール可能性とユーティリティのトレードオフを研究するためのものだ。
論文 参考訳(メタデータ) (2026-02-10T08:12:23Z) - MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Reinforcement Learning for Code Generation [64.2621682259008]
セルフサーチスケーリングによるマルチエージェント強化トレーニングと推論フレームワーク(MARTI-MARS2)
本稿では,MARTI-MARS2を用いたマルチエージェント強化学習・推論フレームワークを提案する。
我々は、MARTI-MARS2が77.7%を獲得し、GPT-5.1のような強力なベースラインを、挑戦的なコード生成ベンチマークで上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-08T07:28:44Z) - Why Keep Your Doubts to Yourself? Trading Visual Uncertainties in Multi-Agent Bandit Systems [21.356119126402902]
私たちは、不確実性のための分散市場として調整を再構築するフレームワークであるAgoraを紹介します。
トンプソンサンプリングを拡張した市場対応ブローカーは、協力を開始し、コスト効率の高い均衡に向けてシステムを誘導する。
結果は、市場ベースのコーディネーションを、経済的に実行可能なビジュアルインテリジェンスシステムを構築するための原則的でスケーラブルなパラダイムとして確立する。
論文 参考訳(メタデータ) (2026-01-26T17:58:53Z) - SAMP-HDRL: Segmented Allocation with Momentum-Adjusted Utility for Multi-agent Portfolio Management via Hierarchical Deep Reinforcement Learning [4.743963988265057]
マルチエージェントポートフォリオ管理のためのMomentum-Adjusted Utilityを用いたセグメンテッドアロケーションを提案する。
このフレームワークは動的資産グループ化を統合し、市場を高品質で通常のサブセットに分割する。
提案手法は,リターン率5%以上,ソルティーノ比5%以上,オメガ比2%以上,ゲイン率を著しく向上させる。
論文 参考訳(メタデータ) (2025-12-28T11:56:39Z) - MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources [113.33902847941941]
VAS (Variance-Aware Sampling) は、Variance Promotion Score (VPS) によって導かれるデータ選択戦略である。
我々は、1.6MのCoT冷間開始データと15kのRLQAペアを含む大規模かつ慎重にキュレートされたリソースをリリースする。
数学的推論ベンチマークによる実験では、キュレートされたデータと提案されたVASの有効性が示されている。
論文 参考訳(メタデータ) (2025-09-25T14:58:29Z) - Scalable Fairness Shaping with LLM-Guided Multi-Agent Reinforcement Learning for Peer-to-Peer Electricity Markets [3.7321070110102075]
ピアツーピア(P2P)エネルギー取引は現代の流通システムの中心となっている。
フェアネスを考慮したマルチエージェント強化学習フレームワークであるFairMarket-RLを提案する。
この枠組みは、取引所を地元のP2P取引にシフトさせ、グリッドのみの調達に対する消費者コストを下げ、参加者間の強い公正性を維持し、実用性を維持する。
論文 参考訳(メタデータ) (2025-08-26T02:25:17Z) - Multi-Agent Reinforcement Learning for Dynamic Pricing in Supply Chains: Benchmarking Strategic Agent Behaviours under Realistically Simulated Market Conditions [4.072683489517408]
本研究では,MARL(Multi-Agent Reinforcement Learning)がサプライチェーンの動的価格戦略をどのように改善するかを検討する。
MARLは、静的な価格ルールに縛られずに、突発的な戦略行動を導入し、ダイナミックな価格設定における将来の発展を知らせる。
論文 参考訳(メタデータ) (2025-07-03T15:07:37Z) - From Debate to Equilibrium: Belief-Driven Multi-Agent LLM Reasoning via Bayesian Nash Equilibrium [52.28048367430481]
マルチエージェントフレームワークは、大規模言語モデル(LLM)の推論能力を高めることができるが、通常は計算コストと収束保証が欠如している。
我々は、不完全情報ゲームとしてマルチLLMコーディネーションをリキャストし、ベイズナッシュ均衡(BNE)を求める。
我々は、分散推論と集中的な最終出力を結合する階層的強化学習パラダイムである、Nash Equilibrium (ECON)による効率的なコーディネーションを導入する。
論文 参考訳(メタデータ) (2025-06-09T23:49:14Z) - CH-MARL: Constrained Hierarchical Multiagent Reinforcement Learning for Sustainable Maritime Logistics [0.0]
CH-MARLは階層的意思決定と動的制約執行と公正な報酬形成を統合している。
模擬海洋ロジスティクス環境で行った実験は、排出をかなり減少させることを示した。
CH-MARLは、マルチエージェント調整課題に対するスケーラブルで一般化可能なソリューションを提供する。
論文 参考訳(メタデータ) (2025-02-04T07:13:21Z) - On the Equity of Nuclear Norm Maximization in Unsupervised Domain
Adaptation [53.29437277730871]
核ノルムは、教師なし領域適応モデルの転送可能性を高める力を示している。
クラスレベルとサンプルレベルから予測的差別性と株式の両方を最大化する2つの新たな損失が提案されている。
論文 参考訳(メタデータ) (2022-04-12T07:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。