論文の概要: Optimizing Heat Alert Issuance with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2312.14196v2
- Date: Sun, 10 Mar 2024 20:37:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 14:50:16.524802
- Title: Optimizing Heat Alert Issuance with Reinforcement Learning
- Title(参考訳): 強化学習による熱アラート発行の最適化
- Authors: Ellen M. Considine, Rachel C. Nethery, Gregory A. Wellenius, Francesca
Dominici, Mauricio Tec
- Abstract要約: 気候変動への社会適応の鍵となる戦略は、予防行動を促すことによって極端な熱事象の健康への影響を減少させる警告システムを使用することである。
本研究では,そのようなシステムの有効性を最適化するツールとしての強化学習について検討する。
まず,新しいRL環境を導入し,ヒートアラーム対策の有効性を評価し,熱関連入院を減らした。
第2に、この環境を用いて、ヒートアラート発行の文脈における標準RLアルゴリズムの評価を行う。
第3に、ポストホックコントラスト分析は、私たちの修正されたヒートアラート-RLポリシーが、現在の大きな利得/損失をもたらすシナリオに関する洞察を提供する。
- 参考スコア(独自算出の注目度): 2.9248916859490173
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A key strategy in societal adaptation to climate change is the use of alert
systems to reduce the adverse health impacts of extreme heat events by
prompting preventative action. In this work, we investigate reinforcement
learning (RL) as a tool to optimize the effectiveness of such systems. Our
contributions are threefold. First, we introduce a novel RL environment
enabling the evaluation of the effectiveness of heat alert policies to reduce
heat-related hospitalizations. The rewards model is trained from a
comprehensive dataset of historical weather, Medicare health records, and
socioeconomic/geographic features. We use variational Bayesian techniques to
address low-signal effects and spatial heterogeneity, which are commonly
encountered in climate & health settings. The transition model incorporates
real historical weather patterns enriched by a data augmentation mechanism
based on climate region similarity. Second, we use this environment to evaluate
standard RL algorithms in the context of heat alert issuance. Our analysis
shows that policy constraints are needed to improve the initially poor
performance of RL. Lastly, a post hoc contrastive analysis provides insight
into scenarios where our modified heat alert-RL policies yield significant
gains/losses over the current National Weather Service alert policy in the
United States.
- Abstract(参考訳): 気候変動に対する社会適応の鍵となる戦略は、予防行動の促進によって極端な熱事象の健康への影響を減少させる警告システムを使用することである。
本研究では,これらのシステムの有効性を最適化するためのツールとして,強化学習(RL)について検討する。
私たちの貢献は3倍です。
まず,新しいRL環境を導入し,ヒートアラーム対策の有効性を評価し,熱関連入院を減らした。
報酬モデルは、歴史的気象、医療医療医療記録、社会経済的・地理的特徴の包括的なデータセットから訓練される。
低信号効果と空間的不均一性に対処するために,変分ベイズ法を用いる。
移行モデルは、気候領域の類似性に基づいたデータ拡張メカニズムによって強化された実際の歴史的気象パターンを組み込む。
第2に、この環境を用いて、ヒートアラート発行の文脈における標準RLアルゴリズムを評価する。
分析の結果,初期のRLの性能改善には政策制約が必要であることがわかった。
最後に、ポストホックのコントラスト分析は、我々の修正されたヒートアラート-RLポリシーが、米国の現在の国家気象サービスアラートポリシーに対して大きな利益/損失をもたらすシナリオに関する洞察を提供する。
関連論文リスト
- Efficient Localized Adaptation of Neural Weather Forecasting: A Case Study in the MENA Region [62.09891513612252]
地域レベルのダウンストリームタスクに特化して、リミテッド・エリア・モデリングに焦点を合わせ、モデルをトレーニングします。
我々は,気象予報が水資源の管理,農業,極度の気象事象の影響軽減に重要であるという,気象学的課題からMENA地域を考察する。
本研究では,パラメータ効率のよい微調整手法,特にローランド適応(LoRA)とその変種を統合することの有効性を検証することを目的とした。
論文 参考訳(メタデータ) (2024-09-11T19:31:56Z) - RAIN: Reinforcement Algorithms for Improving Numerical Weather and Climate Models [0.0]
現在の気候モデルは、サブグリッドスケールのプロセスを表現するために複雑な数学的パラメータ化に依存している。
本研究は,重要なパラメータ化課題に対処するために,強化学習と理想的な気候モデルを統合することを検討する。
論文 参考訳(メタデータ) (2024-08-28T20:10:46Z) - Go Beyond Black-box Policies: Rethinking the Design of Learning Agent
for Interpretable and Verifiable HVAC Control [3.326392645107372]
熱力学モデルと過去のデータから抽出した決定木を用いてHVACコントローラを再設計することでボトルネックを克服する。
本手法は68.4%のエネルギーを節約し, 人間の快適度を14.8%向上させる。
論文 参考訳(メタデータ) (2024-02-29T22:42:23Z) - Improving Building Temperature Forecasting: A Data-driven Approach with
System Scenario Clustering [3.2114754609864695]
暖房、換気、空調のシステムは、建築セクターにおけるエネルギー使用量の約40%を消費する。
大規模HVACシステム管理では,各サブシステムに対して詳細なモデルを構築することは困難である。
k平均クラスタリング法に基づく新しいデータ駆動室温予測モデルを提案する。
論文 参考訳(メタデータ) (2024-02-21T09:04:45Z) - Location Agnostic Source-Free Domain Adaptive Learning to Predict Solar
Power Generation [0.0]
本稿では,気象特性を用いた太陽発電を推定するためのドメイン適応型ディープラーニングフレームワークを提案する。
フィードフォワード深部畳み込みネットワークモデルは、既知の位置データセットを教師付きでトレーニングし、後に未知の場所の太陽エネルギーを予測するために使用される。
我々の手法では、カリフォルニア(CA)、フロリダ(FL)、ニューヨーク(NY)の順応的でない手法と比較して、太陽エネルギー予測精度が10.47 %、7.44 %、5.11%の改善が見られた。
論文 参考訳(メタデータ) (2024-01-24T02:08:48Z) - WARM: On the Benefits of Weight Averaged Reward Models [63.08179139233774]
Weight Averaged Reward Models (WARM) を提案する。
最良N法とRL法を用いた要約タスクの実験は、WARMがLLM予測の全体的な品質とアライメントを改善することを示す。
論文 参考訳(メタデータ) (2024-01-22T18:27:08Z) - Comparing Data-Driven and Mechanistic Models for Predicting Phenology in
Deciduous Broadleaf Forests [47.285748922842444]
我々は、気象時系列から表現指標を予測するために、ディープニューラルネットワークを訓練する。
このアプローチは従来のプロセスベースのモデルよりも優れています。
論文 参考訳(メタデータ) (2024-01-08T15:29:23Z) - Climate-sensitive Urban Planning through Optimization of Tree Placements [55.11389516857789]
気候変動は、熱波を含む多くの極端な気象事象の強度と頻度を増している。
最も有望な戦略の1つは、街路樹の恩恵を利用して歩行者レベルの環境を冷やすことである。
物理シミュレーションでは、樹木の放射的および熱的影響が人間の熱的快適性に与える影響を推定できるが、高い計算コストが生じる。
我々は,屋外の熱的快適さの駆動因子である点平均放射温度を,様々な時間スケールでシミュレーションするためにニューラルネットワークを用いた。
論文 参考訳(メタデータ) (2023-10-09T13:07:23Z) - Improving extreme weather events detection with light-weight neural
networks [0.0]
気候データから熱帯低気圧と大気河川のセマンティックセグメンテーションを訓練した軽量なコンテキストガイド畳み込みニューラルネットワークアーキテクチャを改良した。
我々の主な焦点は熱帯のサイクロンであり、最も破壊的な気象現象であり、現在のモデルでは性能が限られている。
論文 参考訳(メタデータ) (2023-03-31T23:38:54Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z) - A Transfer Learning approach to Heatmap Regression for Action Unit
intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。
本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。
ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文 参考訳(メタデータ) (2020-04-14T16:51:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。