論文の概要: MARLEM: A Multi-Agent Reinforcement Learning Simulation Framework for Implicit Cooperation in Decentralized Local Energy Markets
- arxiv url: http://arxiv.org/abs/2602.16063v1
- Date: Tue, 17 Feb 2026 22:22:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.457693
- Title: MARLEM: A Multi-Agent Reinforcement Learning Simulation Framework for Implicit Cooperation in Decentralized Local Energy Markets
- Title(参考訳): MARLEM - 分散型地域エネルギー市場におけるインシシデント協力のためのマルチエージェント強化学習フレームワーク
- Authors: Nelson Salazar-Pena, Alejandra Tabares, Andres Gonzalez-Mancera,
- Abstract要約: 本稿では,LEMにおける暗黙的な協調を研究するための,オープンソースのMARLシミュレーションフレームワークを提案する。
本フレームワークは,プラグアンドプレイのクリアリング機構,物理的に制約されたエージェントモデル,リアルグリッドネットワークを備えたモジュール型市場プラットフォームを特徴とする。
主な貢献は暗黙の協力を促進する新しい方法であり、エージェントの観察と報酬がシステムレベルのパフォーマンス指標によって強化される。
- 参考スコア(独自算出の注目度): 41.99844472131922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a novel, open-source MARL simulation framework for studying implicit cooperation in LEMs, modeled as a decentralized partially observable Markov decision process and implemented as a Gymnasium environment for MARL. Our framework features a modular market platform with plug-and-play clearing mechanisms, physically constrained agent models (including battery storage), a realistic grid network, and a comprehensive analytics suite to evaluate emergent coordination. The main contribution is a novel method to foster implicit cooperation, where agents' observations and rewards are enhanced with system-level key performance indicators to enable them to independently learn strategies that benefit the entire system and aim for collectively beneficial outcomes without explicit communication. Through representative case studies (available in a dedicated GitHub repository in https://github.com/salazarna/marlem, we show the framework's ability to analyze how different market configurations (such as varying storage deployment) impact system performance. This illustrates its potential to facilitate emergent coordination, improve market efficiency, and strengthen grid stability. The proposed simulation framework is a flexible, extensible, and reproducible tool for researchers and practitioners to design, test, and validate strategies for future intelligent, decentralized energy systems.
- Abstract(参考訳): 本稿では、分散化された部分観測可能なマルコフ決定プロセスとしてモデル化され、MARLのためのジムナシウム環境として実装されたLEMにおける暗黙の協調を研究するための、オープンソースのMARLシミュレーションフレームワークを提案する。
当社のフレームワークは,プラグアンドプレイのクリアリング機構,物理的に制約されたエージェントモデル(バッテリーストレージを含む),現実的なグリッドネットワーク,創発的コーディネーションを評価する包括的な分析スイートを備えたモジュール型市場プラットフォームを備えている。
エージェントの観察と報酬をシステムレベルのパフォーマンス指標で強化し、システム全体の利益をもたらす戦略を独立的に学習し、明示的なコミュニケーションを伴わずに総合的に有益な成果を目標とする、暗黙の協力を促進する新しい方法である。
代表的なケーススタディ(https://github.com/salazarna/marlemにある専用のGitHubリポジトリで利用可能)を通じて、さまざまな市場構成(ストレージ配置の変更など)がシステムパフォーマンスに与える影響を分析するフレームワークの能力を示す。
このことは、創発的な調整を促進し、市場効率を改善し、グリッド安定性を強化する可能性を示している。
提案されたシミュレーションフレームワークは、研究者や実践者が将来のインテリジェントで分散化されたエネルギーシステムのための戦略を設計、テスト、検証するための、柔軟で拡張可能で再現可能なツールである。
関連論文リスト
- Achieving Equilibrium under Utility Heterogeneity: An Agent-Attention Framework for Multi-Agent Multi-Objective Reinforcement Learning [30.138706163658597]
本稿では,エージェント型マルチエージェント多目的強化学習(AA-MAMORL)フレームワークを提案する。
我々のアプローチは、訓練中に、他のエージェントのユーティリティ機能と関連するポリシーに対する共同信条を暗黙的に学習する。
実行中、各エージェントは、BNEを近似するために、ローカル観測とプライベートユーティリティ機能に基づいて、独立してアクションを選択する。
論文 参考訳(メタデータ) (2025-11-12T03:06:21Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - Robo-taxi Fleet Coordination at Scale via Reinforcement Learning [21.266509380044912]
この研究は、数学的モデリングとデータ駆動技術を統合する新しい意思決定フレームワークを導入している。
本稿では、強化学習のレンズを通してAMoDコーディネート問題を示し、グラフネットワークに基づくフレームワークを提案する。
特に、強化学習のレンズを通してAMoDコーディネート問題を示し、グラフネットワークに基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-08T15:19:41Z) - Cooperative Multi-Agent Planning with Adaptive Skill Synthesis [16.228784877899976]
本稿では、視覚言語モデル(VLM)を動的スキルライブラリと統合し、分散化されたクローズドループ決定のための構造化通信を行う新しいマルチエージェントアーキテクチャを提案する。
デモからブートストラップされたスキルライブラリは、プラナー誘導タスクを通じて進化し、適応戦略を実現する。
我々は、その最先端のMARLベースラインに対して、対称シナリオと非対称シナリオの両方で強力な性能を示す。
論文 参考訳(メタデータ) (2025-02-14T13:23:18Z) - A Local Information Aggregation based Multi-Agent Reinforcement Learning for Robot Swarm Dynamic Task Allocation [4.144893164317513]
分散化された部分観測可能なマルコフ決定プロセス(Dec_POMDP)を用いた新しいフレームワークを提案する。
我々の方法論の核心は、局所情報集約多元決定政策勾配(LIA_MADDPG)アルゴリズムである。
実験により,LIAモジュールは様々なCTDEベースのMARL法にシームレスに統合可能であることが示された。
論文 参考訳(メタデータ) (2024-11-29T07:53:05Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Cooperative Policy Learning with Pre-trained Heterogeneous Observation
Representations [51.8796674904734]
事前訓練された異種観察表現を用いた新たな協調学習フレームワークを提案する。
エンコーダ-デコーダに基づくグラフアテンションを用いて、複雑な相互作用と異種表現を学習する。
論文 参考訳(メタデータ) (2020-12-24T04:52:29Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z) - MARS-Gym: A Gym framework to model, train, and evaluate Recommender
Systems for Marketplaces [51.123916699062384]
MARS-Gymは、市場におけるレコメンデーションのための強化学習エージェントの構築と評価を行うオープンソースフレームワークである。
本稿では,Trivagoマーケットプレースデータセットにおいて,さまざまなベースラインエージェントの実装とメトリクス駆動による分析を行う。
学術研究と生産システムとのギャップを埋め、新しいアルゴリズムやアプリケーションの設計を容易にしたいと考えている。
論文 参考訳(メタデータ) (2020-09-30T16:39:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。