論文の概要: Incentive-Aligned Vehicle-to-Vehicle Energy Trading via Nash-Integrated Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.22363v1
- Date: Thu, 21 May 2026 11:57:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.239476
- Title: Incentive-Aligned Vehicle-to-Vehicle Energy Trading via Nash-Integrated Multi-Agent Reinforcement Learning
- Title(参考訳): Nash-Integrated Multi-Agent Reinforcement Learning による車車間エネルギートレーディング
- Authors: Yujin Lin, Yue Yang, Hao Wang,
- Abstract要約: 電気自動車(EV)間の分散ピアツーピアエネルギー交換を可能にするV2Vエネルギートレーディング
既存のアプローチでは、計算の制限を伴う集中的な最適化が必要か、公平性の保証が欠如している。
本稿では、インセンティブに整合したV2Vエネルギー取引において、Nash Bartting SolutionをマルチエージェントのDeep Deterministic Policy Gradient、すなわちNash-MADDPGに統合する。
- 参考スコア(独自算出の注目度): 10.15544554883407
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vehicle-to-vehicle (V2V) energy trading enables decentralized peer-to-peer energy exchange among electric vehicles (EVs), reducing grid dependency while monetizing surplus capacity. However, coordinating self-interested EV agents with diverse charging needs and uncertain arrival-departure schedules remains challenging. Existing approaches either require centralized optimization with computational limitations or lack fairness guarantees. This paper integrates Nash Bargaining Solution into Multi-Agent Deep Deterministic Policy Gradient, namely Nash-MADDPG, for incentive-aligned V2V energy trading. Nash bargaining determines efficient bilateral pricing, while Nash-guided price proximity rewards align agent learning toward bargaining-optimal strategies. Evaluation over 30-day continuous operation demonstrates an improvement of 61.6% in social welfare and 62.9% improvement in trading volume over Double Auction, while achieving superior fairness, such as 40.1% improvement in Jain's index. Testing across 6-100 agents over a 30-day horizon with continuous vehicle turnover confirms scalability across population size and empirically stable pricing near the Nash Bargaining benchmark.
- Abstract(参考訳): 車両間エネルギー取引(V2V)は、電気自動車(EV)間の分散ピアツーピアエネルギー交換を可能にし、余剰容量を収益化しながらグリッド依存性を低減させる。
しかし、多彩な充電ニーズと不確実な到着予定を兼ね備えた自家用EVエージェントの調整は依然として困難である。
既存のアプローチでは、計算の制限を伴う集中的な最適化が必要か、公平性の保証が欠如している。
本稿では、インセンティブに整合したV2Vエネルギー取引において、Nash Bartting SolutionをマルチエージェントのDeep Deterministic Policy Gradient、すなわちNash-MADDPGに統合する。
ナッシュバーゲティングは効果的な二国間価格を決定する一方、ナッシュガイド付き価格近接報酬はエージェント学習を交渉最適戦略に合わせる。
30日間の連続運転による評価は、社会福祉の61.6%の改善、ダブルオークションの62.9%改善、ジャイナ指数の40.1%改善など優れた公正性を実現している。
6-100エージェントを30日間の地平線上でテストすることで、人口規模にわたるスケーラビリティと、ナッシュバーゲティングベンチマーク付近で実証的に安定した価格が確認できる。
関連論文リスト
- Near-Future Policy Optimization [51.760544033045726]
検証可能な報酬(RLVR)による強化学習は、学習後の中核的なレシピとなっている。
textbfNear-Future textbfPolicy textbfOptimization (textbfNPO)を提案する。
論文 参考訳(メタデータ) (2026-04-22T16:20:41Z) - Context-Aware Agentic Power Resources Optimisation in EV using Smart2ChargeApp [0.5070542698701156]
本稿では,Smart2Chargeアプリケーションを通じて,電気自動車(EV)充電エコシステムのコンテキスト依存型マルチエージェントコーディネートを提案する。
提案システムは、250台のEVと45台の充電ステーションのネットワークにまたがる自律充電エージェントを調整する。
当社のマルチエージェントアプローチでは,グラフニューラルネットワークとアテンション機構を統合したDeep Q-Networksを採用している。
論文 参考訳(メタデータ) (2025-12-12T21:41:13Z) - OPV: Outcome-based Process Verifier for Efficient Long Chain-of-Thought Verification [91.15649744496834]
本稿では、長い思考の連鎖から要約された結果の合理化過程を検証する、アウトカムベースプロセス検証(OPV)を提案する。
OPV は 76.3 と比較して F1 スコアが 83.1 の Qwen3-Max-Preview など,はるかに大きなオープンソースモデルよりも優れています。
論文 参考訳(メタデータ) (2025-12-11T15:47:38Z) - Peer-to-Peer Energy Trading in Dairy Farms using Multi-Agent Reinforcement Learning [1.7616042687330642]
農村部における再生可能エネルギー資源の統合により、P2P(Peer-to-Peer)エネルギートレーディングによる分散型エネルギー管理が可能になる。
本研究は、効率的なエネルギー分配におけるP2Pトレーディングの役割と高度な最適化手法との相乗効果を明らかにする。
論文 参考訳(メタデータ) (2025-11-28T12:53:10Z) - Scalable Fairness Shaping with LLM-Guided Multi-Agent Reinforcement Learning for Peer-to-Peer Electricity Markets [3.7321070110102075]
ピアツーピア(P2P)エネルギー取引は現代の流通システムの中心となっている。
フェアネスを考慮したマルチエージェント強化学習フレームワークであるFairMarket-RLを提案する。
この枠組みは、取引所を地元のP2P取引にシフトさせ、グリッドのみの調達に対する消費者コストを下げ、参加者間の強い公正性を維持し、実用性を維持する。
論文 参考訳(メタデータ) (2025-08-26T02:25:17Z) - Coalitional Bargaining via Reinforcement Learning: An Application to
Collaborative Vehicle Routing [49.00137468773683]
コラボレーティブ・ビークル・ルーティング(Collaborative Vehicle Routing)とは、デリバリ情報を共有し、互いに代理してデリバリ要求を実行することで、デリバリ企業が協力する場所である。
これによりスケールの経済が達成され、コスト、温室効果ガスの排出、道路渋滞が減少する。
しかし、どの会社が誰とパートナーし、それぞれの会社がどれだけの報酬を支払うべきか?
シャプリー値(英語版)やヌクレオルス(英語版)のような伝統的なゲーム理論解の概念は、協調車両ルーティング(英語版)の現実問題に対して計算することが困難である。
論文 参考訳(メタデータ) (2023-10-26T15:04:23Z) - Robust Electric Vehicle Balancing of Autonomous Mobility-On-Demand
System: A Multi-Agent Reinforcement Learning Approach [6.716627474314613]
電気自動車(EAV)は、将来の自動運転モビリティ・オン・デマンド(AMoD)システムで注目を集めている。
EAVのユニークな充電パターンは、E-AMoDシステムにおけるEAVの供給を正確に予測することを困難にしている。
強化学習に基づくE-AMoDバランスアルゴリズムの成功にもかかわらず、EV供給や移動需要による状態の不確実性は未解明のままである。
論文 参考訳(メタデータ) (2023-07-30T13:40:42Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。