論文の概要: Optimizing Heat Alert Issuance with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2312.14196v4
- Date: Thu, 19 Dec 2024 20:22:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 16:20:00.621518
- Title: Optimizing Heat Alert Issuance with Reinforcement Learning
- Title(参考訳): 強化学習によるヒートアレルト発行の最適化
- Authors: Ellen M. Considine, Rachel C. Nethery, Gregory A. Wellenius, Francesca Dominici, Mauricio Tec,
- Abstract要約: 気候変動への社会適応の鍵となる戦略は、警報システムを使用して予防行動を促進し、極端な熱イベントの健康への影響を減少させることである。
本稿では,これらのシステムの有効性を最適化するためのツールとして,強化学習を実装し,評価する。
まず, ヒートアラーム対策の有効性を評価できる新しいRL環境を導入し, 熱関連入院率の低減を図る。
第2に、この環境を用いて、ヒートアラート発行の文脈における標準RLアルゴリズムの評価を行う。
第3に、ポストホックのコントラスト分析は、私たちの修正されたヒートアラート-RLポリシーが、現在の大きな利得/損失をもたらすシナリオに関する洞察を提供する。
- 参考スコア(独自算出の注目度): 2.7262923206583136
- License:
- Abstract: A key strategy in societal adaptation to climate change is using alert systems to prompt preventative action and reduce the adverse health impacts of extreme heat events. This paper implements and evaluates reinforcement learning (RL) as a tool to optimize the effectiveness of such systems. Our contributions are threefold. First, we introduce a new publicly available RL environment enabling the evaluation of the effectiveness of heat alert policies to reduce heat-related hospitalizations. The rewards model is trained from a comprehensive dataset of historical weather, Medicare health records, and socioeconomic/geographic features. We use scalable Bayesian techniques tailored to the low-signal effects and spatial heterogeneity present in the data. The transition model uses real historical weather patterns enriched by a data augmentation mechanism based on climate region similarity. Second, we use this environment to evaluate standard RL algorithms in the context of heat alert issuance. Our analysis shows that policy constraints are needed to improve RL's initially poor performance. Third, a post-hoc contrastive analysis provides insight into scenarios where our modified heat alert-RL policies yield significant gains/losses over the current National Weather Service alert policy in the United States.
- Abstract(参考訳): 気候変動への社会適応の鍵となる戦略は、警報システムを使用して予防措置を推進し、極端な熱事象の健康への影響を減らすことである。
本稿では,これらのシステムの有効性を最適化するためのツールとして,強化学習(RL)を実装し,評価する。
私たちの貢献は3倍です。
まず, ヒートアラーム対策の有効性を評価できる新しいRL環境を導入し, 熱関連入院率の低減を図る。
報酬モデルは、歴史的気象、医療の健康記録、社会経済的・地理学的特徴の包括的なデータセットから訓練される。
我々は、データの低信号効果と空間的不均一性に合わせたスケーラブルなベイズ手法を用いる。
移行モデルは、気候領域の類似性に基づいたデータ拡張メカニズムによって強化された実際の歴史的気象パターンを使用する。
第2に、この環境を用いて、ヒートアラート発行の文脈における標準RLアルゴリズムの評価を行う。
我々の分析は、当初RLの性能が低かったため、ポリシーの制約が要求されることを示している。
第3に、ポストホックのコントラスト分析は、我々の修正されたヒートアラート-RLポリシーが、米国の現在の国家気象サービスアラートポリシーに対して大きな利益/損失をもたらすシナリオに関する洞察を提供する。
関連論文リスト
- Efficient Localized Adaptation of Neural Weather Forecasting: A Case Study in the MENA Region [62.09891513612252]
地域レベルのダウンストリームタスクに特化して、リミテッド・エリア・モデリングに焦点を合わせ、モデルをトレーニングします。
我々は,気象予報が水資源の管理,農業,極度の気象事象の影響軽減に重要であるという,気象学的課題からMENA地域を考察する。
本研究では,パラメータ効率のよい微調整手法,特にローランド適応(LoRA)とその変種を統合することの有効性を検証することを目的とした。
論文 参考訳(メタデータ) (2024-09-11T19:31:56Z) - RAIN: Reinforcement Algorithms for Improving Numerical Weather and Climate Models [0.0]
現在の気候モデルは、サブグリッドスケールのプロセスを表現するために複雑な数学的パラメータ化に依存している。
本研究は,重要なパラメータ化課題に対処するために,強化学習と理想的な気候モデルを統合することを検討する。
論文 参考訳(メタデータ) (2024-08-28T20:10:46Z) - Go Beyond Black-box Policies: Rethinking the Design of Learning Agent
for Interpretable and Verifiable HVAC Control [3.326392645107372]
熱力学モデルと過去のデータから抽出した決定木を用いてHVACコントローラを再設計することでボトルネックを克服する。
本手法は68.4%のエネルギーを節約し, 人間の快適度を14.8%向上させる。
論文 参考訳(メタデータ) (2024-02-29T22:42:23Z) - Improving Building Temperature Forecasting: A Data-driven Approach with
System Scenario Clustering [3.2114754609864695]
暖房、換気、空調のシステムは、建築セクターにおけるエネルギー使用量の約40%を消費する。
大規模HVACシステム管理では,各サブシステムに対して詳細なモデルを構築することは困難である。
k平均クラスタリング法に基づく新しいデータ駆動室温予測モデルを提案する。
論文 参考訳(メタデータ) (2024-02-21T09:04:45Z) - Location Agnostic Source-Free Domain Adaptive Learning to Predict Solar
Power Generation [0.0]
本稿では,気象特性を用いた太陽発電を推定するためのドメイン適応型ディープラーニングフレームワークを提案する。
フィードフォワード深部畳み込みネットワークモデルは、既知の位置データセットを教師付きでトレーニングし、後に未知の場所の太陽エネルギーを予測するために使用される。
我々の手法では、カリフォルニア(CA)、フロリダ(FL)、ニューヨーク(NY)の順応的でない手法と比較して、太陽エネルギー予測精度が10.47 %、7.44 %、5.11%の改善が見られた。
論文 参考訳(メタデータ) (2024-01-24T02:08:48Z) - WARM: On the Benefits of Weight Averaged Reward Models [63.08179139233774]
Weight Averaged Reward Models (WARM) を提案する。
最良N法とRL法を用いた要約タスクの実験は、WARMがLLM予測の全体的な品質とアライメントを改善することを示す。
論文 参考訳(メタデータ) (2024-01-22T18:27:08Z) - Comparing Data-Driven and Mechanistic Models for Predicting Phenology in
Deciduous Broadleaf Forests [47.285748922842444]
我々は、気象時系列から表現指標を予測するために、ディープニューラルネットワークを訓練する。
このアプローチは従来のプロセスベースのモデルよりも優れています。
論文 参考訳(メタデータ) (2024-01-08T15:29:23Z) - Climate-sensitive Urban Planning through Optimization of Tree Placements [55.11389516857789]
気候変動は、熱波を含む多くの極端な気象事象の強度と頻度を増している。
最も有望な戦略の1つは、街路樹の恩恵を利用して歩行者レベルの環境を冷やすことである。
物理シミュレーションでは、樹木の放射的および熱的影響が人間の熱的快適性に与える影響を推定できるが、高い計算コストが生じる。
我々は,屋外の熱的快適さの駆動因子である点平均放射温度を,様々な時間スケールでシミュレーションするためにニューラルネットワークを用いた。
論文 参考訳(メタデータ) (2023-10-09T13:07:23Z) - Improving extreme weather events detection with light-weight neural
networks [0.0]
気候データから熱帯低気圧と大気河川のセマンティックセグメンテーションを訓練した軽量なコンテキストガイド畳み込みニューラルネットワークアーキテクチャを改良した。
我々の主な焦点は熱帯のサイクロンであり、最も破壊的な気象現象であり、現在のモデルでは性能が限られている。
論文 参考訳(メタデータ) (2023-03-31T23:38:54Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z) - A Transfer Learning approach to Heatmap Regression for Action Unit
intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。
本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。
ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文 参考訳(メタデータ) (2020-04-14T16:51:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。