論文の概要: Benchmarking Scientific Machine Learning Models for Air Quality Data
- arxiv url: http://arxiv.org/abs/2603.21039v1
- Date: Sun, 22 Mar 2026 03:31:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.203201
- Title: Benchmarking Scientific Machine Learning Models for Air Quality Data
- Title(参考訳): 大気質データのための科学機械学習モデルのベンチマーク
- Authors: Khawja Imran Masud, Venkata Sai Rahul Unnam, Sahara Ali,
- Abstract要約: 本研究は、ガイドラインと提案された物理誘導型最良のモデルを可能にする、説明可能で包括的なベンチマークを示す。
2022年から2024年にかけて、米国環境保護庁(EPA)による大気質データの日次観測を用いて、PM2.5とO3の都市レベルの時系列をキュレートする。
最適モデルのベンチマークには、線形回帰(LR)、SARIMAX、多層パーセプトロン(MLP)、LSTMネットワークが評価されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate air quality index (AQI) forecasting is essential for the protecting public health in rapidly growing urban regions, and the practical model evaluation and selection are often challenged by the lack of rigorous, region-specific benchmarking on standardized datasets. Physics-guided machine learning and deep learning models could be a good and effective solution to resolve such issues with more accurate and efficient AQI forecasting. This research study presents an explainable and comprehensive benchmark that enables a guideline and proposed physics-guided best model by benchmarking classical time-series, machine-learning, and deep-learning approaches for multi-horizon AQI forecasting in North Texas (Dallas County). Using publicly available U.S. Environmental Protection Agency (EPA) daily observations of air quality data from 2022 to 2024, we curate city-level time series for PM2.5 and O3 by aggregating station measurements and constructing lag-wise forecasting datasets for LAG in {1,7,14,30} days. For benchmarking the best model, linear regression (LR), SARIMAX, multilayer perceptrons (MLP), and LSTM networks are evaluated with the proposed physics-guided variants (MLP+Physics and LSTM+Physics) that incorporate the EPA breakpoint-based AQI formulation as a consistency constraint through a weighted loss. Experiments using chronological train-test splits and error metrics MAE, RMSE showed that deep-learning models outperform simpler baselines, while physics guidance improves stability and yields physically consistent pollutant with AQI relationships, with the largest benefits observed for short-horizon prediction and for PM2.5 and O3. Overall, the results provide a practical reference for selecting AQI forecasting models in North Texas and clarify when lightweight physics constraints meaningfully improve predictive performance across pollutants and forecast horizons.
- Abstract(参考訳): 都市部における公衆衛生の保護には,正確な大気質指標(AQI)の予測が不可欠であり,標準化されたデータセット上での厳密な地域別ベンチマークの欠如により,実用的モデル評価と選択が課題となることが多い。
物理誘導型機械学習とディープラーニングモデルは、より正確で効率的なAQI予測によってそのような問題を解決するのに、優れた、効果的なソリューションになり得る。
本研究は,北テキサス(ダラス郡)におけるマルチホライゾンAQI予測のための古典的時系列,機械学習,ディープラーニングアプローチをベンチマークすることで,物理誘導型ベストモデルに関するガイドラインと提案を可能にする,説明可能な総合的ベンチマークを提案する。
2022年から2024年までの環境保護庁(EPA)による大気質データの日次観測を用いて, PM2.5とO3の都市レベルの時系列を, 局計測の集約と, {1,7,14,30} 日間のLAGのラグワイズ予測データセットの構築によりキュレートする。
最適モデルのベンチマークには、EPAブレークポイントに基づくAQI定式化を重み付き損失による一貫性制約として組み込んだ物理誘導型(MLP+PhysicsとLSTM+Physics)を用いて、線形回帰(LR)、SARIMAX、多層パーセプトロン(MLP)、LSTMネットワークを評価した。
MAE, RMSE実験では, 深層学習モデルはより単純なベースラインよりも優れており, 物理ガイダンスでは安定性が向上し, AQI関係と物理的に一貫した汚染物質が得られた。
その結果,北テキサスにおけるAQI予測モデルの選択と,軽量物理制約が汚染物質や予測地平線を越えた予測性能を有意に向上させるかどうかを明らかにするための実践的基準が得られた。
関連論文リスト
- Reduced-Order Surrogates for Forced Flexible Mesh Coastal-Ocean Models [0.0]
本稿では,気象強制と境界条件を組み込んだフレキシブルなクープマンオートエンコーダを提案する。
性能をPODベースのサロゲートと体系的に比較する。
論文 参考訳(メタデータ) (2026-02-05T07:59:58Z) - IISE PG&E Energy Analytics Challenge 2025: Hourly-Binned Regression Models Beat Transformers in Load Forecasting [0.0]
本研究では,古典的回帰手法から高度なディープラーニングアーキテクチャに至るまで,予測モデルを評価する。
このデータセットには、過去2年間の電力負荷データと、5つの場所にわたる温度およびグローバル水平照射(GHI)が含まれている。
その結果、TimeGPTを含むディープラーニングモデルは、より単純な統計的および機械学習アプローチを一貫して上回りません。
論文 参考訳(メタデータ) (2025-05-16T15:55:34Z) - Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [68.94373533768501]
我々は、知識保持をモデル化し、そのコーパスから事実情報を記憶するための事前学習言語モデルの能力を示し、学習前にそれを推定する原則的手法を導入する。
本稿では,知識周波数,知識特異度,モデルサイズを統合し,クローズドブック質問応答(QA)の精度を予測する情報理論予測器である,サイズ依存型相互情報(SMI)を提案する。
論文 参考訳(メタデータ) (2025-02-06T13:23:53Z) - OMG-HD: A High-Resolution AI Weather Model for End-to-End Forecasts from Observations [11.729902584481767]
OMG-HDは、観測データソースから直接予測を行うように設計されたAIベースの高解像度天気予報モデルである。
RMSEは温度2mで最大13%,風速10mで17%,比湿度2mで48%,表面圧力で32%向上した。
論文 参考訳(メタデータ) (2024-12-24T07:46:50Z) - Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文 参考訳(メタデータ) (2024-02-02T10:34:13Z) - A Machine Learning Outlook: Post-processing of Global Medium-range
Forecasts [0.0]
後処理は通常、数値気象予測(NWP)モデルの出力を受け取り、線形統計手法を適用する。
本研究では, 温度850hPaで7日間の予測において, 最大12%(RMSE)の精度向上を達成できることを示す。
我々は、ルート平均二乗誤差 (RMSE) や異常相関係数 (ACC) といった標準メトリクスを使用する際の課題について議論する。
論文 参考訳(メタデータ) (2023-03-28T20:48:01Z) - Forecast-Aware Model Driven LSTM [0.0]
粗悪な空気質は人間の健康に大きな影響を及ぼす可能性がある。
モデルバイアスを補正するために使われる伝統的な手法は、線形性や基礎となる分布について仮定する。
ディープラーニングは、極端な空気質のイベントが存在する場合に、空気質の予測を約束する。
論文 参考訳(メタデータ) (2023-03-23T00:03:07Z) - Federated Learning in the Sky: Aerial-Ground Air Quality Sensing
Framework with UAV Swarms [53.38353133198842]
空気質は人間の健康に大きく影響し、空気質指数(AQI)の正確かつタイムリーな予測がますます重要になっている。
本稿では, 精密な3次元空気質モニタリングと予測を行うための, 新たなフェデレーション学習型地上空気質検知フレームワークを提案する。
地中センシングシステムでは, グラフ畳み込みニューラルネットワークを用いたLong Short-Term Memory (GC-LSTM) モデルを提案し, 高精度, リアルタイム, 将来的なAQI推論を実現する。
論文 参考訳(メタデータ) (2020-07-23T13:32:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。