論文の概要: InfraLib: Enabling Reinforcement Learning and Decision Making for Large Scale Infrastructure Management
- arxiv url: http://arxiv.org/abs/2409.03167v1
- Date: Thu, 5 Sep 2024 01:54:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 22:33:03.231095
- Title: InfraLib: Enabling Reinforcement Learning and Decision Making for Large Scale Infrastructure Management
- Title(参考訳): InfraLib: 大規模インフラストラクチャ管理のための強化学習と意思決定の実現
- Authors: Pranay Thangeda, Trevor S. Betz, Michael N. Grussing, Melkior Ornik,
- Abstract要約: InfraLibは、インフラストラクチャ管理の問題のモデリングと分析のための包括的なフレームワークである。
コンポーネントの可用性のモデル化、周期的予算、破滅的な失敗など、実用的な機能をサポートしています。
InfraLibの能力は、現実世界の道路ネットワークと10万のコンポーネントによる総合ベンチマークのケーススタディを通じて実証する。
- 参考スコア(独自算出の注目度): 1.0499611180329806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient management of infrastructure systems is crucial for economic stability, sustainability, and public safety. However, infrastructure management is challenging due to the vast scale of systems, stochastic deterioration of components, partial observability, and resource constraints. While data-driven approaches like reinforcement learning (RL) offer a promising avenue for optimizing management policies, their application to infrastructure has been limited by the lack of suitable simulation environments. We introduce InfraLib, a comprehensive framework for modeling and analyzing infrastructure management problems. InfraLib employs a hierarchical, stochastic approach to realistically model infrastructure systems and their deterioration. It supports practical functionality such as modeling component unavailability, cyclical budgets, and catastrophic failures. To facilitate research, InfraLib provides tools for expert data collection, simulation-driven analysis, and visualization. We demonstrate InfraLib's capabilities through case studies on a real-world road network and a synthetic benchmark with 100,000 components.
- Abstract(参考訳): インフラシステムの効率的な管理は、経済の安定、持続可能性、公共の安全に不可欠である。
しかし, システムの大規模化, コンポーネントの確率的劣化, 部分観測可能性, 資源制約などにより, インフラ管理は困難である。
強化学習(RL)のようなデータ駆動型アプローチは、管理ポリシーを最適化するための有望な手段を提供するが、適切なシミュレーション環境が欠如しているため、インフラストラクチャへの適用は制限されてきた。
InfraLibはインフラ管理の問題をモデリングし分析するための総合的なフレームワークである。
InfraLibは階層的で確率的なアプローチを採用して、現実的にインフラシステムとその劣化をモデル化している。
コンポーネントの可用性のモデル化、周期的予算、破滅的な失敗など、実用的な機能をサポートしています。
研究を容易にするため、InfraLibは専門家データ収集、シミュレーション駆動分析、可視化のためのツールを提供している。
InfraLibの能力は、現実世界の道路ネットワークと10万のコンポーネントによる総合ベンチマークのケーススタディを通じて実証する。
関連論文リスト
- Microservice Deployment in Space Computing Power Networks via Robust Reinforcement Learning [43.96374556275842]
低レイテンシ要件を満たすために、信頼性の高いリアルタイムリモートセンシングサービスを提供することが重要である。
本稿では、低地球軌道衛星コンステレーション用に設計されたリモートセンシング人工知能アプリケーションデプロイメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-08T16:55:04Z) - Multi-agent deep reinforcement learning with centralized training and
decentralized execution for transportation infrastructure management [0.0]
本稿では,大規模交通インフラシステムをライフサイクル上で管理するための多エージェント深層強化学習(DRL)フレームワークを提案する。
このようなエンジニアリングシステムのライフサイクル管理は計算集約的な作業であり、適切なシーケンシャルな検査とメンテナンスの決定を必要とする。
論文 参考訳(メタデータ) (2024-01-23T02:52:36Z) - Accountability in Offline Reinforcement Learning: Explaining Decisions
with a Corpus of Examples [70.84093873437425]
本稿では、オフラインデータセットを決定コーパスとして利用するAOC(Accountable Offline Controller)を紹介する。
AOCはローデータシナリオで効果的に動作し、厳密なオフラインの模倣設定まで拡張でき、保存性と適応性の両方の品質を示す。
シミュレーションおよび実世界の医療シナリオにおいて、AOCのパフォーマンスを評価し、説明責任を維持しながら高いレベルのパフォーマンスでオフライン制御タスクを管理する能力を強調した。
論文 参考訳(メタデータ) (2023-10-11T17:20:32Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [55.08287089554127]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - IIVA: A Simulation Based Generalized Framework for Interdependent
Infrastructure Vulnerability Assessment [0.0]
本稿では,新たなインフラストラクチャ脆弱性評価フレームワークを提案する。
コンポーネントの初期失敗率が高いほど、インフラストラクチャの脆弱性が大きくなることが観察された。
論文 参考訳(メタデータ) (2022-12-13T20:37:03Z) - ModularFed: Leveraging Modularity in Federated Learning Frameworks [8.139264167572213]
本稿では,フェデレートラーニング(FL)実装の複雑さに対処する研究に焦点を当てたフレームワークを提案する。
このアーキテクチャでは、プロトコルはフレームワークのコンポーネントの設計を厳密に定義する青写真である。
我々のプロトコルはFLにおけるモジュラリティの実現を目的としており、サードパーティのプラグイン・アンド・プレイアーキテクチャと動的シミュレータをサポートしています。
論文 参考訳(メタデータ) (2022-10-31T10:21:19Z) - Inference and dynamic decision-making for deteriorating systems with
probabilistic dependencies through Bayesian networks and deep reinforcement
learning [0.0]
劣化する環境に露呈するエンジニアリングシステムに対して,不確実性を考慮した推論と意思決定のための効率的なアルゴリズムフレームワークを提案する。
政策最適化の観点では、深層分散型マルチエージェントアクター・クリティカル(DDMAC)強化学習アプローチを採用する。
その結果、DDMACポリシーは最先端のアプローチと比較して大きな利点をもたらすことが示された。
論文 参考訳(メタデータ) (2022-09-02T14:45:40Z) - Exploiting Temporal Structures of Cyclostationary Signals for
Data-Driven Single-Channel Source Separation [98.95383921866096]
単一チャネルソース分離(SCSS)の問題点について検討する。
我々は、様々なアプリケーション領域に特に適するサイクロ定常信号に焦点を当てる。
本稿では,最小MSE推定器と競合するU-Netアーキテクチャを用いたディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T14:04:56Z) - Causal Fairness Analysis [68.12191782657437]
意思決定設定における公平性の問題を理解し、モデル化し、潜在的に解決するためのフレームワークを導入します。
我々のアプローチの主な洞察は、観測データに存在する格差の定量化と、基礎となる、しばしば観測されていない、因果的なメカニズムの収集を結びつけることである。
本研究は,文献中の異なる基準間の関係を整理し,説明するための最初の体系的試みであるフェアネスマップにおいて,本研究の成果を左右するものである。
論文 参考訳(メタデータ) (2022-07-23T01:06:34Z) - On Telecommunication Service Imbalance and Infrastructure Resource
Deployment [95.80185574417428]
本稿では,通信サービス不均衡,通信インフラ,人口分布の関係を定量的に関連付けることを目的とした,細粒度で計算が容易な不均衡指数を提案する。
また,この指標に基づいて,任意の地理的セグメントの平均不均衡指数を最小化することにより,インフラ資源の展開戦略を提案する。
論文 参考訳(メタデータ) (2021-04-08T17:45:32Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。