論文の概要: Beyond the Hype: Comparing Lightweight and Deep Learning Models for Air Quality Forecasting
- arxiv url: http://arxiv.org/abs/2512.09076v1
- Date: Tue, 09 Dec 2025 19:39:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.301886
- Title: Beyond the Hype: Comparing Lightweight and Deep Learning Models for Air Quality Forecasting
- Title(参考訳): ハイプを超えて:空気質予測のための軽量と深層学習モデルの比較
- Authors: Moazzam Umer Gondal, Hamad ul Qudous, Asma Ahmad Farhan,
- Abstract要約: 本研究では,Facebook Prophet (FBP) とNeural Prophet (NP) の軽量付加モデルが,中国の北京で粒子状物質の競合予測を実現するかどうかを検討する。
複数年間の汚染物質および気象データを用いて,系統的特徴選択(相関,相互情報,mRMR),リークセーフスケーリング,時系列データ分割を適用した。
その結果, FBPはNP, SARIMAX, 学習ベースラインを一貫して上回り, 両方の汚染物質に対してR2$以上を達成できた。
- 参考スコア(独自算出の注目度): 1.2744523252873352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate forecasting of urban air pollution is essential for protecting public health and guiding mitigation policies. While Deep Learning (DL) and hybrid pipelines dominate recent research, their complexity and limited interpretability hinder operational use. This study investigates whether lightweight additive models -- Facebook Prophet (FBP) and NeuralProphet (NP) -- can deliver competitive forecasts for particulate matter (PM$_{2.5}$, PM$_{10}$) in Beijing, China. Using multi-year pollutant and meteorological data, we applied systematic feature selection (correlation, mutual information, mRMR), leakage-safe scaling, and chronological data splits. Both models were trained with pollutant and precursor regressors, with NP additionally leveraging lagged dependencies. For context, two machine learning baselines (LSTM, LightGBM) and one traditional statistical model (SARIMAX) were also implemented. Performance was evaluated on a 7-day holdout using MAE, RMSE, and $R^2$. Results show that FBP consistently outperformed NP, SARIMAX, and the learning-based baselines, achieving test $R^2$ above 0.94 for both pollutants. These findings demonstrate that interpretable additive models remain competitive with both traditional and complex approaches, offering a practical balance of accuracy, transparency, and ease of deployment.
- Abstract(参考訳): 都市大気汚染の正確な予測は、公衆衛生の保護と緩和政策の導出に不可欠である。
ディープラーニング(DL)とハイブリッドパイプラインが最近の研究を支配している一方で、その複雑さと限定的な解釈可能性によって運用が妨げられている。
本研究は,中国の北京において,軽量加法モデルであるFacebook Prophet (FBP) とNeural Prophet (NP) が粒子状物質 (PM$_{2.5}$, PM$_{10}$) の競合予測を実現できるかどうかを検討する。
複数年間の汚染物質および気象データを用いて,系統的特徴選択(相関,相互情報,mRMR),リークセーフスケーリング,時系列データ分割を適用した。
どちらのモデルも汚染物質と前駆体の回帰剤で訓練され、NPはラタグの依存関係も活用した。
2つの機械学習ベースライン(LSTM, LightGBM)と1つの従来の統計モデル(SARIMAX)も実装された。
MAE, RMSE, および$R^2$を用いて7日間のホールドアウトで評価した。
その結果, FBPはNP, SARIMAX, 学習ベースラインを一貫して上回り, いずれの汚染物質もR^2$以上0.94。
これらの結果は、解釈可能な付加モデルが従来のアプローチと複雑なアプローチの両方と競合し続けており、精度、透明性、デプロイメントの容易さの現実的なバランスを提供することを示している。
関連論文リスト
- Lightweight ML-Based Air Quality Prediction for IoT and Embedded Applications [0.0]
本研究では,XGBoost回帰モデルの2つの変種の有効性と効率について検討した。
完全なXGBoostモデルは両方の汚染物質に対して優れた予測精度を達成したが、小さなモデルはわずかに正確ではないが、かなりの計算上の利点をもたらした。
これにより、IoTおよび組み込みアプリケーションにおけるリアルタイムの空気品質監視に適した、小さなXGBoostモデルが実現される。
論文 参考訳(メタデータ) (2025-11-26T19:31:20Z) - A comparison between geostatistical and machine learning models for spatio-temporal prediction of PM2.5 data [0.0]
PM2.5$の高濃度への曝露は、呼吸や心血管系病院の入院の増加、救急部門の訪問や死亡の増大と関係している。
伝統的な空気質監視システムは、空間的および時間的データに制限がある。
低コストセンサーの出現により、空気品質データの粒度が劇的に向上し、リアルタイムで高解像度なモニタリングが可能になった。
この研究は、PurpleAirセンサーからの広範なデータを利用して、カリフォルニア州全体で正確な時間ごとのPM$_2.5$マップの作成において、様々な統計モデルと機械学習モデルの有効性を評価し、比較する。
論文 参考訳(メタデータ) (2025-09-15T15:32:57Z) - When Simpler Wins: Facebooks Prophet vs LSTM for Air Pollution Forecasting in Data-Constrained Northern Nigeria [0.44198435146063364]
本研究では,複数汚染物質を予測するためのLong Short-Term Memory(LSTM)ネットワークとFacebook Prophetモデルを評価する。
その結果、預言者はしばしばLSTMの正確さ、特に季節的・長期的な傾向に支配されるシリーズにおいて一致または超えていることがわかった。
論文 参考訳(メタデータ) (2025-08-22T09:23:59Z) - Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination [67.67725938962798]
大規模なWebスケールコーパスの事前トレーニングは、広く使用されているベンチマークでデータ汚染の影響を受けやすいQwen2.5が残る。
我々はRandomCalculationと呼ばれる任意の長さと難易度を持つ完全クリーンな算術問題を生成するジェネレータを導入する。
精度の高い報酬信号のみがベースモデルの性能境界を超える安定した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2025-07-14T17:55:15Z) - ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs [75.72672339168092]
本稿では,新しいトラジェクトリ対応PRMであるReasonFlux-PRMを紹介し,トラジェクトリ応答型推論トレースの評価を行う。
ReasonFlux-PRMはステップレベルとトラジェクトリレベルの両方の監視機能を備えており、構造化された連鎖データと整合した微粒な報酬割り当てを可能にする。
得られたReasonFlux-PRM-7Bは、教師付き微調整で平均12.1%、強化学習で4.5%、テスト時間スケーリングで6.3%向上した。
論文 参考訳(メタデータ) (2025-06-23T17:59:02Z) - Machine Learning Models for Reinforced Concrete Pipes Condition Prediction: The State-of-the-Art Using Artificial Neural Networks and Multiple Linear Regression in a Wisconsin Case Study [0.0]
合衆国の老朽化した下水道インフラは210万キロメートルをカバーしており、構造的な問題に直面している。
年間約75,000の衛生用下水道が深刻な経済、環境、公衆衛生の危険を生じさせている。
本研究は,機械学習モデルを用いて下水道パイプラインの状態の予測精度を向上させることを目的とする。
論文 参考訳(メタデータ) (2025-02-01T08:16:08Z) - Load Forecasting for Households and Energy Communities: Are Deep Learning Models Worth the Effort? [0.0]
エネルギーコミュニティ(EC)は、地域需要のシフトと自己充足力の向上に重要な役割を果たしている。
データ駆動予測は注目されているが、多くの実践的な文脈ではまだ十分に調査されていない。
本研究は, 地域規模, 歴史的データ可用性, モデルの複雑さなど, 最先端のディープラーニングモデルの有効性を評価する。
論文 参考訳(メタデータ) (2025-01-09T06:29:50Z) - Scaling Laws for Predicting Downstream Performance in LLMs [75.28559015477137]
この研究は、性能推定のためのより計算効率のよい指標として、事前学習損失に焦点を当てている。
FLP-Mは、事前トレーニング中に複数のソースからのデータセットを統合する実践的なニーズに対処する、パフォーマンス予測の基本的なアプローチである。
論文 参考訳(メタデータ) (2024-10-11T04:57:48Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - Learning representations with end-to-end models for improved remaining
useful life prognostics [64.80885001058572]
残りの設備の実用寿命(RUL)は、現在の時刻と故障までの期間として定義される。
マルチ層パーセプトロンと長期メモリ層(LSTM)に基づくエンドツーエンドのディープラーニングモデルを提案し、RULを予測する。
提案するエンド・ツー・エンドのモデルがこのような優れた結果を達成し、他のディープラーニングや最先端の手法と比較する方法について論じる。
論文 参考訳(メタデータ) (2021-04-11T16:45:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。