論文の概要: Entropy-Constrained Strategy Optimization in Urban Floods: A Multi-Agent Framework with LLM and Knowledge Graph Integration
- arxiv url: http://arxiv.org/abs/2508.14654v1
- Date: Wed, 20 Aug 2025 12:13:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.445747
- Title: Entropy-Constrained Strategy Optimization in Urban Floods: A Multi-Agent Framework with LLM and Knowledge Graph Integration
- Title(参考訳): 都市洪水におけるエントロピー制約型戦略最適化: LLMと知識グラフの統合によるマルチエージェントフレームワーク
- Authors: Peilin Ji, Xiao Xue, Simeng Wang, Wenhao Yan,
- Abstract要約: 都市部での降雨は緊急時スケジューリングシステムに重大な課題をもたらす。
H-Jは、知識誘導的プロンプト、エントロピー制約生成、フィードバック駆動最適化を統合する階層的なマルチエージェントフレームワークである。
実験の結果,H-Jは交通のスムーズさ,タスク成功率,システムの堅牢性において,ルールベースおよび強化学習ベースラインよりも優れていた。
- 参考スコア(独自算出の注目度): 0.7424725048947504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the increasing frequency of extreme urban rainfall events has posed significant challenges to emergency scheduling systems. Urban flooding often leads to severe traffic congestion and service disruptions, threatening public safety and mobility. However, effective decision making remains hindered by three key challenges: (1) managing trade-offs among competing goals (e.g., traffic flow, task completion, and risk mitigation) requires dynamic, context-aware strategies; (2) rapidly evolving environmental conditions render static rules inadequate; and (3) LLM-generated strategies frequently suffer from semantic instability and execution inconsistency. Existing methods fail to align perception, global optimization, and multi-agent coordination within a unified framework. To tackle these challenges, we introduce H-J, a hierarchical multi-agent framework that integrates knowledge-guided prompting, entropy-constrained generation, and feedback-driven optimization. The framework establishes a closed-loop pipeline spanning from multi-source perception to strategic execution and continuous refinement. We evaluate H-J on real-world urban topology and rainfall data under three representative conditions: extreme rainfall, intermittent bursts, and daily light rain. Experiments show that H-J outperforms rule-based and reinforcement-learning baselines in traffic smoothness, task success rate, and system robustness. These findings highlight the promise of uncertainty-aware, knowledge-constrained LLM-based approaches for enhancing resilience in urban flood response.
- Abstract(参考訳): 近年,都市部における豪雨の発生頻度の増加は,緊急時スケジューリングシステムに重大な課題をもたらしている。
都市洪水はしばしば交通渋滞とサービスの混乱を引き起こし、公共の安全と移動を脅かす。
しかし,(1)競合する目標(例えば,交通フロー,タスク完了,リスク軽減)間のトレードオフを管理するためには,動的かつ状況に応じた戦略が必要であり,(2)急速に発展する環境条件が静的なルールを不適切に表現し,(3)LCMが生成する戦略は意味的不安定性や実行の不整合に悩まされることが多い。
既存の方法は、認識、大域最適化、統合されたフレームワーク内でのマルチエージェント調整の整合に失敗する。
これらの課題に対処するために,知識誘導型プロンプト,エントロピー制約付き生成,フィードバック駆動型最適化を統合した階層型マルチエージェントフレームワークであるH-Jを導入する。
このフレームワークは、マルチソースの認識から戦略的実行、継続的な改善まで、クローズドループパイプラインを確立する。
実際の都市トポロジーと降雨量のH-Jを, 極端降雨, 断続バースト, 日中降雨の3つの代表的な条件下で評価した。
実験の結果,H-Jは交通のスムーズさ,タスク成功率,システムの堅牢性において,ルールベースおよび強化学習ベースラインよりも優れていた。
これらの知見は, 都市洪水応答のレジリエンスを高めるための, 不確実性を認識し, 知識に制約のあるLLMベースのアプローチの可能性を浮き彫りにした。
関連論文リスト
- HiLight: A Hierarchical Reinforcement Learning Framework with Global Adversarial Guidance for Large-Scale Traffic Signal Control [22.185954207474907]
HiLightは大規模信号制御のためのグローバルな逆方向誘導を備えた階層型強化学習フレームワークである。
合成および実世界のベンチマークでHiLightを評価し,交通条件の異なる大規模マンハッタンネットワークを構築した。
論文 参考訳(メタデータ) (2025-06-17T10:39:42Z) - EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-18T03:15:55Z) - Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - Towards Practical Operation of Deep Reinforcement Learning Agents in Real-World Network Management at Open RAN Edges [5.345501810244355]
Deep Reinforcement Learning (DRL)は、高度なネットワークにおける接続性、信頼性、低レイテンシ、運用効率の増大に対応する強力なソリューションとして登場した。
まず,ETSIマルチアクセスエッジコンピューティング(MEC)とOpen RANを統合するオーケストレーションフレームワークを提案する。
1)予測不能またはバースト的なトラフィックからの非同期要求、(2)不均一なトポロジと進化するサービス要求への適応性と一般化、(3)探索による収束とサービス中断の延長など、DRLの現実的な展開を妨げる3つの重要な課題を特定する。
論文 参考訳(メタデータ) (2024-10-30T15:02:54Z) - Scalable Multi-Objective Optimization for Robust Traffic Signal Control in Uncertain Environments [7.504173535502228]
本稿では,動的かつ不確実な都市環境におけるロバストな交通信号制御のための,スケーラブルな多目的最適化手法を提案する。
都市交通の不確実性に対処する適応ハイブリッド多目的最適化アルゴリズム(AHMOA)を提案する。
シミュレーションはマンハッタン、パリ、サンパウロ、イスタンブールなど様々な都市で行われている。
論文 参考訳(メタデータ) (2024-09-20T10:42:16Z) - LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T08:41:55Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。