論文の概要: Entropy-Constrained Strategy Optimization in Urban Floods: A Multi-Agent Framework with LLM and Knowledge Graph Integration
- arxiv url: http://arxiv.org/abs/2508.14654v1
- Date: Wed, 20 Aug 2025 12:13:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.445747
- Title: Entropy-Constrained Strategy Optimization in Urban Floods: A Multi-Agent Framework with LLM and Knowledge Graph Integration
- Title(参考訳): 都市洪水におけるエントロピー制約型戦略最適化: LLMと知識グラフの統合によるマルチエージェントフレームワーク
- Authors: Peilin Ji, Xiao Xue, Simeng Wang, Wenhao Yan,
- Abstract要約: 都市部での降雨は緊急時スケジューリングシステムに重大な課題をもたらす。
H-Jは、知識誘導的プロンプト、エントロピー制約生成、フィードバック駆動最適化を統合する階層的なマルチエージェントフレームワークである。
実験の結果,H-Jは交通のスムーズさ,タスク成功率,システムの堅牢性において,ルールベースおよび強化学習ベースラインよりも優れていた。
- 参考スコア(独自算出の注目度): 0.7424725048947504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the increasing frequency of extreme urban rainfall events has posed significant challenges to emergency scheduling systems. Urban flooding often leads to severe traffic congestion and service disruptions, threatening public safety and mobility. However, effective decision making remains hindered by three key challenges: (1) managing trade-offs among competing goals (e.g., traffic flow, task completion, and risk mitigation) requires dynamic, context-aware strategies; (2) rapidly evolving environmental conditions render static rules inadequate; and (3) LLM-generated strategies frequently suffer from semantic instability and execution inconsistency. Existing methods fail to align perception, global optimization, and multi-agent coordination within a unified framework. To tackle these challenges, we introduce H-J, a hierarchical multi-agent framework that integrates knowledge-guided prompting, entropy-constrained generation, and feedback-driven optimization. The framework establishes a closed-loop pipeline spanning from multi-source perception to strategic execution and continuous refinement. We evaluate H-J on real-world urban topology and rainfall data under three representative conditions: extreme rainfall, intermittent bursts, and daily light rain. Experiments show that H-J outperforms rule-based and reinforcement-learning baselines in traffic smoothness, task success rate, and system robustness. These findings highlight the promise of uncertainty-aware, knowledge-constrained LLM-based approaches for enhancing resilience in urban flood response.
- Abstract(参考訳): 近年,都市部における豪雨の発生頻度の増加は,緊急時スケジューリングシステムに重大な課題をもたらしている。
都市洪水はしばしば交通渋滞とサービスの混乱を引き起こし、公共の安全と移動を脅かす。
しかし,(1)競合する目標(例えば,交通フロー,タスク完了,リスク軽減)間のトレードオフを管理するためには,動的かつ状況に応じた戦略が必要であり,(2)急速に発展する環境条件が静的なルールを不適切に表現し,(3)LCMが生成する戦略は意味的不安定性や実行の不整合に悩まされることが多い。
既存の方法は、認識、大域最適化、統合されたフレームワーク内でのマルチエージェント調整の整合に失敗する。
これらの課題に対処するために,知識誘導型プロンプト,エントロピー制約付き生成,フィードバック駆動型最適化を統合した階層型マルチエージェントフレームワークであるH-Jを導入する。
このフレームワークは、マルチソースの認識から戦略的実行、継続的な改善まで、クローズドループパイプラインを確立する。
実際の都市トポロジーと降雨量のH-Jを, 極端降雨, 断続バースト, 日中降雨の3つの代表的な条件下で評価した。
実験の結果,H-Jは交通のスムーズさ,タスク成功率,システムの堅牢性において,ルールベースおよび強化学習ベースラインよりも優れていた。
これらの知見は, 都市洪水応答のレジリエンスを高めるための, 不確実性を認識し, 知識に制約のあるLLMベースのアプローチの可能性を浮き彫りにした。
関連論文リスト
- OmniVL-Guard: Towards Unified Vision-Language Forgery Detection and Grounding via Balanced RL [63.388513841293616]
既存の偽造検出手法は、現実世界の誤報に多いインターリーブされたテキスト、画像、ビデオを扱うのに失敗する。
このギャップを埋めるため,本論文では,オムニバス・ビジョン言語による偽造検出と接地のための統一フレームワークの開発を目標としている。
我々は、OmniVL-Guardという、オムニバス視覚言語による偽造検出と接地のためのバランスの取れた強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-11T09:41:36Z) - PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution [64.15555230987222]
PACEvolveはエージェントのコンテキストと検索ダイナミクスを堅牢に管理するように設計されたフレームワークである。
PACEvolveは、一貫性のある長期自己改善のための体系的なパスを提供する。
論文 参考訳(メタデータ) (2026-01-15T18:25:23Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - Incorporating Quality of Life in Climate Adaptation Planning via Reinforcement Learning [2.1499528348377535]
強化学習(Reinforcement Learning, RL)は、複雑で動的で不確実な問題に対処する上で、大きな可能性を秘めている。
我々はRLを用いて、長期にわたってどの気候適応経路が生活の質を高めるかを特定する。
予備的な結果は,本手法が最適適応の学習に有効であることが示唆され,他の現実的かつ現実的な計画戦略よりも優れていた。
論文 参考訳(メタデータ) (2025-11-05T07:00:55Z) - ReCAP: Recursive Context-Aware Reasoning and Planning for Large Language Model Agents [61.51091799997476]
ReCAP(Recursive Context-Aware Reasoning and Planning)は,大規模言語モデル(LLM)における推論と計画のためのコンテキストを共有する階層型フレームワークである。
ReCAPは、プラン-アヘッド分解、親プランの構造化された再注入、メモリ効率の高い実行という3つの重要なメカニズムを組み合わせる。
実験により、ReCAPは様々なロングホライゾン推論ベンチマークにおけるサブゴールアライメントと成功率を大幅に改善することが示された。
論文 参考訳(メタデータ) (2025-10-27T20:03:55Z) - SORA-ATMAS: Adaptive Trust Management and Multi-LLM Aligned Governance for Future Smart Cities [0.32839375042867835]
エージェントAIは、自律的な意思決定と適応的な調整をサポートすることで、重要な実現手段として登場した。
不均一なスマートシティエコシステムへのデプロイメントは、重要なガバナンス、リスク、コンプライアンス(GRC)の課題を提起する。
SORA-ATMASは、分散エージェントのアウトプットを説明可能なリアルタイムな決定に集約する、規制に準拠した、コンテキスト対応で検証可能なガバナンスフレームワークである。
論文 参考訳(メタデータ) (2025-10-22T07:40:37Z) - An Explainable Deep Neural Network with Frequency-Aware Channel and Spatial Refinement for Flood Prediction in Sustainable Cities [5.100600023634809]
XFloodNetは、高度なディープラーニング技術によって都市洪水分類を再定義する新しいフレームワークである。
XFloodNetは93.33%、82.24%、88.60%という最先端のF1スコアを達成し、既存の手法をかなり上回っている。
論文 参考訳(メタデータ) (2025-09-07T19:39:28Z) - HiLight: A Hierarchical Reinforcement Learning Framework with Global Adversarial Guidance for Large-Scale Traffic Signal Control [22.185954207474907]
HiLightは大規模信号制御のためのグローバルな逆方向誘導を備えた階層型強化学習フレームワークである。
合成および実世界のベンチマークでHiLightを評価し,交通条件の異なる大規模マンハッタンネットワークを構築した。
論文 参考訳(メタデータ) (2025-06-17T10:39:42Z) - EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-18T03:15:55Z) - Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - Towards Practical Operation of Deep Reinforcement Learning Agents in Real-World Network Management at Open RAN Edges [5.345501810244355]
Deep Reinforcement Learning (DRL)は、高度なネットワークにおける接続性、信頼性、低レイテンシ、運用効率の増大に対応する強力なソリューションとして登場した。
まず,ETSIマルチアクセスエッジコンピューティング(MEC)とOpen RANを統合するオーケストレーションフレームワークを提案する。
1)予測不能またはバースト的なトラフィックからの非同期要求、(2)不均一なトポロジと進化するサービス要求への適応性と一般化、(3)探索による収束とサービス中断の延長など、DRLの現実的な展開を妨げる3つの重要な課題を特定する。
論文 参考訳(メタデータ) (2024-10-30T15:02:54Z) - Scalable Multi-Objective Optimization for Robust Traffic Signal Control in Uncertain Environments [7.504173535502228]
本稿では,動的かつ不確実な都市環境におけるロバストな交通信号制御のための,スケーラブルな多目的最適化手法を提案する。
都市交通の不確実性に対処する適応ハイブリッド多目的最適化アルゴリズム(AHMOA)を提案する。
シミュレーションはマンハッタン、パリ、サンパウロ、イスタンブールなど様々な都市で行われている。
論文 参考訳(メタデータ) (2024-09-20T10:42:16Z) - LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T08:41:55Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。