論文の概要: JaxWildfire: A GPU-Accelerated Wildfire Simulator for Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.06102v1
- Date: Fri, 05 Dec 2025 19:06:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.186299
- Title: JaxWildfire: A GPU-Accelerated Wildfire Simulator for Reinforcement Learning
- Title(参考訳): JaxWildfire: 強化学習のためのGPU駆動のワイルドファイアシミュレータ
- Authors: Ufuk Çakır, Victor-Alexandru Darvariu, Bruno Lacerda, Nick Hawes,
- Abstract要約: 本稿では,セルオートマトンに基づく確率的火災拡散モデルに基づくシミュレータであるtextttJaxWildfire$を紹介する。
我々は、$textttJaxWildfire$が既存のソフトウェア上で6-35倍の高速化を実現し、パラメータの勾配に基づく最適化を可能にすることを実証した。
我々の研究は、自然災害管理のためのRL技術の進歩に向けた重要なステップである。
- 参考スコア(独自算出の注目度): 17.674265727888063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence methods are increasingly being explored for managing wildfires and other natural hazards. In particular, reinforcement learning (RL) is a promising path towards improving outcomes in such uncertain decision-making scenarios and moving beyond reactive strategies. However, training RL agents requires many environment interactions, and the speed of existing wildfire simulators is a severely limiting factor. We introduce $\texttt{JaxWildfire}$, a simulator underpinned by a principled probabilistic fire spread model based on cellular automata. It is implemented in JAX and enables vectorized simulations using $\texttt{vmap}$, allowing high throughput of simulations on GPUs. We demonstrate that $\texttt{JaxWildfire}$ achieves 6-35x speedup over existing software and enables gradient-based optimization of simulator parameters. Furthermore, we show that $\texttt{JaxWildfire}$ can be used to train RL agents to learn wildfire suppression policies. Our work is an important step towards enabling the advancement of RL techniques for managing natural hazards.
- Abstract(参考訳): 人工知能の手法は、山火事やその他の自然災害を管理するためにますます研究されている。
特に、強化学習(RL)は、不確実な意思決定シナリオの成果を向上し、リアクティブ戦略を超えて進むための、有望な道である。
しかし、RLエージェントの訓練には多くの環境相互作用が必要であり、既存の山火事シミュレータの速度は厳しい制限要因である。
本稿では,セルオートマトンに基づく確率的火災拡散モデルに基づくシミュレータである$\texttt{JaxWildfire}$を紹介する。
JAXで実装され、$\texttt{vmap}$を使ってベクトル化されたシミュレーションを可能にし、GPU上でのシミュレーションのスループットを高める。
我々は、$\texttt{JaxWildfire}$が既存のソフトウェア上で6-35倍の高速化を実現し、シミュレータパラメータの勾配に基づく最適化を可能にすることを実証した。
さらに、$\texttt{JaxWildfire}$は、RLエージェントを訓練して、山火事抑制ポリシーを学ぶために使用できることを示す。
我々の研究は、自然災害管理のためのRL技術の進歩に向けた重要なステップである。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - The Power of Resets in Online Reinforcement Learning [73.64852266145387]
ローカルシミュレータアクセス(あるいはローカルプランニング)を用いたオンライン強化学習を通してシミュレータのパワーを探求する。
カバー性が低いMPPは,Qstar$-realizabilityのみのサンプル効率で学習可能であることを示す。
ローカルシミュレーターアクセス下では, 悪名高いExogenous Block MDP問題が抽出可能であることを示す。
論文 参考訳(メタデータ) (2024-04-23T18:09:53Z) - GarchingSim: An Autonomous Driving Simulator with Photorealistic Scenes
and Minimalist Workflow [24.789118651720045]
光実写シーンを用いた自律走行シミュレータを提案する。
シミュレータはROS2またはSocket.IOを介して外部アルゴリズムと通信することができる。
シミュレータ内に高精度な車両力学モデルを実装し,車体効果の現実性を高める。
論文 参考訳(メタデータ) (2024-01-28T23:26:15Z) - Reinforcement Learning for Wildfire Mitigation in Simulated Disaster
Environments [39.014859667729375]
森林火災は生命、財産、生態学、文化遺産、重要なインフラに脅威をもたらす。
SimFireは、現実的な山火事シナリオを生成するために設計された、多用途の野火投射シミュレータである。
SimHarnessはモジュール型のエージェントベースの機械学習ラッパーで、自動的に土地管理戦略を生成することができる。
論文 参考訳(メタデータ) (2023-11-27T15:37:05Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - FORFIS: A forest fire firefighting simulation tool for education and
research [90.40304110009733]
本稿では,Python で実装された森林火災消火シミュレーションツール FORFIS について述べる。
私たちのツールは underv3 ライセンスを公開しており、GUI と出力機能が追加されています。
論文 参考訳(メタデータ) (2023-05-29T09:14:38Z) - Uncertainty Aware Wildfire Management [6.997483623023005]
アメリカ合衆国では近年の山火事で生命が失われ、数十億ドルが失われた。
大規模に展開するリソースは限られており、火災の広がりを予測することは困難である。
本稿では,山火事対策のための意思決定論的アプローチを提案する。
論文 参考訳(メタデータ) (2020-10-15T17:47:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。