Fugu-MT 論文翻訳(概要): Optimizing Heat Alert Issuance with Reinforcement Learning

論文の概要: Optimizing Heat Alert Issuance with Reinforcement Learning

arxiv url: http://arxiv.org/abs/2312.14196v4
Date: Thu, 19 Dec 2024 20:22:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-23 22:59:32.726872
Title: Optimizing Heat Alert Issuance with Reinforcement Learning
Title（参考訳）: 強化学習によるヒートアレルト発行の最適化
Authors: Ellen M. Considine, Rachel C. Nethery, Gregory A. Wellenius, Francesca Dominici, Mauricio Tec,
Abstract要約: 気候変動への社会適応の鍵となる戦略は、警報システムを使用して予防行動を促進し、極端な熱イベントの健康への影響を減少させることである。本稿では,これらのシステムの有効性を最適化するためのツールとして,強化学習を実装し,評価する。まず, ヒートアラーム対策の有効性を評価できる新しいRL環境を導入し, 熱関連入院率の低減を図る。第2に、この環境を用いて、ヒートアラート発行の文脈における標準RLアルゴリズムの評価を行う。第3に、ポストホックのコントラスト分析は、私たちの修正されたヒートアラート-RLポリシーが、現在の大きな利得/損失をもたらすシナリオに関する洞察を提供する。
参考スコア（独自算出の注目度）: 2.7262923206583136
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: A key strategy in societal adaptation to climate change is using alert systems to prompt preventative action and reduce the adverse health impacts of extreme heat events. This paper implements and evaluates reinforcement learning (RL) as a tool to optimize the effectiveness of such systems. Our contributions are threefold. First, we introduce a new publicly available RL environment enabling the evaluation of the effectiveness of heat alert policies to reduce heat-related hospitalizations. The rewards model is trained from a comprehensive dataset of historical weather, Medicare health records, and socioeconomic/geographic features. We use scalable Bayesian techniques tailored to the low-signal effects and spatial heterogeneity present in the data. The transition model uses real historical weather patterns enriched by a data augmentation mechanism based on climate region similarity. Second, we use this environment to evaluate standard RL algorithms in the context of heat alert issuance. Our analysis shows that policy constraints are needed to improve RL's initially poor performance. Third, a post-hoc contrastive analysis provides insight into scenarios where our modified heat alert-RL policies yield significant gains/losses over the current National Weather Service alert policy in the United States.
Abstract（参考訳）: 気候変動への社会適応の鍵となる戦略は、警報システムを使用して予防措置を推進し、極端な熱事象の健康への影響を減らすことである。本稿では,これらのシステムの有効性を最適化するためのツールとして,強化学習(RL)を実装し,評価する。私たちの貢献は3倍です。まず, ヒートアラーム対策の有効性を評価できる新しいRL環境を導入し, 熱関連入院率の低減を図る。報酬モデルは、歴史的気象、医療の健康記録、社会経済的・地理学的特徴の包括的なデータセットから訓練される。我々は、データの低信号効果と空間的不均一性に合わせたスケーラブルなベイズ手法を用いる。移行モデルは、気候領域の類似性に基づいたデータ拡張メカニズムによって強化された実際の歴史的気象パターンを使用する。第2に、この環境を用いて、ヒートアラート発行の文脈における標準RLアルゴリズムの評価を行う。我々の分析は、当初RLの性能が低かったため、ポリシーの制約が要求されることを示している。第3に、ポストホックのコントラスト分析は、我々の修正されたヒートアラート-RLポリシーが、米国の現在の国家気象サービスアラートポリシーに対して大きな利益/損失をもたらすシナリオに関する洞察を提供する。

関連論文リスト

AEGPO: Adaptive Entropy-Guided Policy Optimization for Diffusion Models [54.56296715999545]
人間のフィードバックからの強化学習は、拡散とフローモデルの整合性を示す。 GRPOのような政策最適化手法は、非効率で静的なサンプリング戦略に悩まされている。適応エントロピー誘導政策最適化(Adaptive Entropy-Guided Policy Optimization, AEGPO)を提案する。
論文参考訳（メタデータ） (2026-02-06T16:09:50Z)
TempSamp-R1: Effective Temporal Sampling with Reinforcement Fine-Tuning for Video LLMs [67.55973229034319]
本稿では,マルチモーダルな大規模言語モデル(MLLM)をビデオ時間的グラウンド処理に適応させることの有効性向上を目的とした,新しい強化微調整フレームワークであるTempSamp-R1を紹介する。我々は、TempSamp-R1がGRPOベースのベースラインより優れており、ベンチマークデータセット上で新しい最先端のパフォーマンスを確立していることを示す。
論文参考訳（メタデータ） (2025-09-22T17:30:15Z)
Efficient Localized Adaptation of Neural Weather Forecasting: A Case Study in the MENA Region [62.09891513612252]
地域レベルのダウンストリームタスクに特化して、リミテッド・エリア・モデリングに焦点を合わせ、モデルをトレーニングします。我々は,気象予報が水資源の管理,農業,極度の気象事象の影響軽減に重要であるという,気象学的課題からMENA地域を考察する。本研究では,パラメータ効率のよい微調整手法,特にローランド適応(LoRA)とその変種を統合することの有効性を検証することを目的とした。
論文参考訳（メタデータ） (2024-09-11T19:31:56Z)
RAIN: Reinforcement Algorithms for Improving Numerical Weather and Climate Models [0.0]
現在の気候モデルは、サブグリッドスケールのプロセスを表現するために複雑な数学的パラメータ化に依存している。本研究は,重要なパラメータ化課題に対処するために,強化学習と理想的な気候モデルを統合することを検討する。
論文参考訳（メタデータ） (2024-08-28T20:10:46Z)
Go Beyond Black-box Policies: Rethinking the Design of Learning Agent for Interpretable and Verifiable HVAC Control [3.326392645107372]
熱力学モデルと過去のデータから抽出した決定木を用いてHVACコントローラを再設計することでボトルネックを克服する。本手法は68.4%のエネルギーを節約し, 人間の快適度を14.8%向上させる。
論文参考訳（メタデータ） (2024-02-29T22:42:23Z)
Improving Building Temperature Forecasting: A Data-driven Approach with System Scenario Clustering [3.2114754609864695]
暖房、換気、空調のシステムは、建築セクターにおけるエネルギー使用量の約40%を消費する。大規模HVACシステム管理では,各サブシステムに対して詳細なモデルを構築することは困難である。 k平均クラスタリング法に基づく新しいデータ駆動室温予測モデルを提案する。
論文参考訳（メタデータ） (2024-02-21T09:04:45Z)
Location Agnostic Source-Free Domain Adaptive Learning to Predict Solar Power Generation [0.0]
本稿では,気象特性を用いた太陽発電を推定するためのドメイン適応型ディープラーニングフレームワークを提案する。フィードフォワード深部畳み込みネットワークモデルは、既知の位置データセットを教師付きでトレーニングし、後に未知の場所の太陽エネルギーを予測するために使用される。我々の手法では、カリフォルニア(CA)、フロリダ(FL)、ニューヨーク(NY)の順応的でない手法と比較して、太陽エネルギー予測精度が10.47 %、7.44 %、5.11%の改善が見られた。
論文参考訳（メタデータ） (2024-01-24T02:08:48Z)
WARM: On the Benefits of Weight Averaged Reward Models [63.08179139233774]
Weight Averaged Reward Models (WARM) を提案する。最良N法とRL法を用いた要約タスクの実験は、WARMがLLM予測の全体的な品質とアライメントを改善することを示す。
論文参考訳（メタデータ） (2024-01-22T18:27:08Z)
Comparing Data-Driven and Mechanistic Models for Predicting Phenology in Deciduous Broadleaf Forests [47.285748922842444]
我々は、気象時系列から表現指標を予測するために、ディープニューラルネットワークを訓練する。このアプローチは従来のプロセスベースのモデルよりも優れています。
論文参考訳（メタデータ） (2024-01-08T15:29:23Z)
Hybrid Reinforcement Learning for Optimizing Pump Sustainability in Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文参考訳（メタデータ） (2023-10-13T21:26:16Z)
Climate-sensitive Urban Planning through Optimization of Tree Placements [55.11389516857789]
気候変動は、熱波を含む多くの極端な気象事象の強度と頻度を増している。最も有望な戦略の1つは、街路樹の恩恵を利用して歩行者レベルの環境を冷やすことである。物理シミュレーションでは、樹木の放射的および熱的影響が人間の熱的快適性に与える影響を推定できるが、高い計算コストが生じる。我々は,屋外の熱的快適さの駆動因子である点平均放射温度を,様々な時間スケールでシミュレーションするためにニューラルネットワークを用いた。
論文参考訳（メタデータ） (2023-10-09T13:07:23Z)
Improving extreme weather events detection with light-weight neural networks [0.0]
気候データから熱帯低気圧と大気河川のセマンティックセグメンテーションを訓練した軽量なコンテキストガイド畳み込みニューラルネットワークアーキテクチャを改良した。我々の主な焦点は熱帯のサイクロンであり、最も破壊的な気象現象であり、現在のモデルでは性能が限られている。
論文参考訳（メタデータ） (2023-03-31T23:38:54Z)
Value-Consistent Representation Learning for Data-Efficient Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文参考訳（メタデータ） (2022-06-25T03:02:25Z)
Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。 KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文参考訳（メタデータ） (2021-10-07T02:28:18Z)
Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文参考訳（メタデータ） (2021-07-14T21:10:47Z)
A Transfer Learning approach to Heatmap Regression for Action Unit intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文参考訳（メタデータ） (2020-04-14T16:51:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。