論文の概要: Predictive Modelling of Air Quality Index (AQI) Across Diverse Cities and States of India using Machine Learning: Investigating the Influence of Punjab's Stubble Burning on AQI Variability
- arxiv url: http://arxiv.org/abs/2404.08702v1
- Date: Thu, 11 Apr 2024 05:03:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-16 19:11:57.983975
- Title: Predictive Modelling of Air Quality Index (AQI) Across Diverse Cities and States of India using Machine Learning: Investigating the Influence of Punjab's Stubble Burning on AQI Variability
- Title(参考訳): 機械学習を用いたインド各都市における大気質指数(AQI)の予測モデル:Punjabの燃焼がAQI変動に及ぼす影響について
- Authors: Kamaljeet Kaur Sidhu, Habeeb Balogun, Kazeem Oluwakemi Oseni,
- Abstract要約: この研究は大気中の異なる大気汚染物質濃度に基づいてAQIを予測した。
このデータセットは、デリー、ハリアナ、パンジャーブの各都市で22の異なる観測所から空気汚染物質濃度を計測する。
CatBoost、XGBoost、Random Forest、SVM回帰器、時系列モデルSARIMAX、ディープラーニングモデルLSTMといったMLモデルは、AQIを予測するために使用されている。
- 参考スコア(独自算出の注目度): 0.5266869303483376
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Air pollution is a common and serious problem nowadays and it cannot be ignored as it has harmful impacts on human health. To address this issue proactively, people should be aware of their surroundings, which means the environment where they survive. With this motive, this research has predicted the AQI based on different air pollutant concentrations in the atmosphere. The dataset used for this research has been taken from the official website of CPCB. The dataset has the air pollutant concentration from 22 different monitoring stations in different cities of Delhi, Haryana, and Punjab. This data is checked for null values and outliers. But, the most important thing to note is the correct understanding and imputation of such values rather than ignoring or doing wrong imputation. The time series data has been used in this research which is tested for stationarity using The Dickey-Fuller test. Further different ML models like CatBoost, XGBoost, Random Forest, SVM regressor, time series model SARIMAX, and deep learning model LSTM have been used to predict AQI. For the performance evaluation of different models, I used MSE, RMSE, MAE, and R2. It is observed that Random Forest performed better as compared to other models.
- Abstract(参考訳): 大気汚染は一般的に深刻な問題であり、人間の健康に有害な影響を及ぼすため無視できない。
この問題に積極的に対処するには、周囲を意識する必要がある。
この動機により、大気中の異なる大気汚染物質濃度に基づいてAQIを予測した。
この研究に使用されるデータセットは、CPCBの公式ウェブサイトから取得されている。
このデータセットは、デリー、ハリアナ、パンジャーブの各都市で22の異なる観測所から空気汚染物質濃度を計測する。
このデータはnull値とoutlierをチェックする。
しかし、注意すべき最も重要なことは、間違った命令を無視したり実行したりするよりも、そのような値の正しい理解と解釈である。
The Dickey-Fuller test を用いて定常性試験を行った。
CatBoost、XGBoost、Random Forest、SVM回帰器、時系列モデルSARIMAX、深層学習モデルLSTMといった他のMLモデルもAQIを予測するために使用されている。
異なるモデルの性能評価のために,MSE,RMSE,MAE,R2を使用しました。
ランダムフォレストは他のモデルに比べて優れた性能を示した。
関連論文リスト
- LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.816876067499415]
我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。
LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。
ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文 参考訳(メタデータ) (2024-10-14T17:51:23Z) - Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Rethinking Benchmark and Contamination for Language Models with
Rephrased Samples [49.18977581962162]
大規模な言語モデルは、これまで人間が生成したすべてのデータに基づいて、ますます訓練されている。
多くの人は、事前トレーニングや微調整のデータセットが汚染される可能性があるとして、公開ベンチマークの信頼性を懸念している。
論文 参考訳(メタデータ) (2023-11-08T17:35:20Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - Managing Large Dataset Gaps in Urban Air Quality Prediction:
DCU-Insight-AQ at MediaEval 2022 [2.0796717061432006]
我々は,AQIが今後1日,5日,7日で予測される大気質データのギャップフィリングに注目した。
シナリオでは、1つまたは複数の空気、天気予報センサーがオフラインにあり、予測精度を調査する。
論文 参考訳(メタデータ) (2022-12-19T16:53:16Z) - GreenEyes: An Air Quality Evaluating Model based on WaveNet [11.513011576336744]
本稿では,シーケンスの表現を学習するためのWaveNetベースのバックボーンブロックと,テンポラルアテンションモジュールを用いたLSTMで構成されるディープニューラルネットワークモデルを提案する。
我々は,データセットから得られた空気質データの任意の部分について,次のタイムスタンプの空気質レベルを効果的に予測できることを示す。
論文 参考訳(メタデータ) (2022-12-08T10:28:57Z) - Data-driven Real-time Short-term Prediction of Air Quality: Comparison
of ES, ARIMA, and LSTM [0.0]
歴史的データに基づく空気質の予測には,データ駆動方式を用いる。
予測精度と時間的複雑さを考慮して, 短時間の大気汚染予測ESは, ARIMAやLSTMよりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-11-16T09:37:08Z) - Predicting air quality via multimodal AI and satellite imagery [0.2492060267829796]
本稿では,監視局が存在しない空気質指標を予測するためのマルチモーダル機械学習モデルを提案する。
欧州大気汚染監視局(ESA Copernicus)プロジェクトからtextitaltitude, population, etc.$などの機能を備えた新しい欧州汚染監視局(ECA)のデータセットが作成されている。
これらの予測は、異なる地域における空気の質を比較するのに使用できる「空気品質指標」を作成するために集約される。
論文 参考訳(メタデータ) (2022-11-01T22:56:15Z) - Evaluation of Time Series Forecasting Models for Estimation of PM2.5
Levels in Air [0.0]
この研究では、環境中のPM2.5濃度を推定するために、ARIMA、FBProphet、LSTM、1D CNNなどのディープラーニングモデルを採用する。
予測結果から,すべての手法が平均根平均二乗誤差で比較結果を与えることがわかった。
論文 参考訳(メタデータ) (2021-04-07T16:24:39Z) - Federated Learning in the Sky: Aerial-Ground Air Quality Sensing
Framework with UAV Swarms [53.38353133198842]
空気質は人間の健康に大きく影響し、空気質指数(AQI)の正確かつタイムリーな予測がますます重要になっている。
本稿では, 精密な3次元空気質モニタリングと予測を行うための, 新たなフェデレーション学習型地上空気質検知フレームワークを提案する。
地中センシングシステムでは, グラフ畳み込みニューラルネットワークを用いたLong Short-Term Memory (GC-LSTM) モデルを提案し, 高精度, リアルタイム, 将来的なAQI推論を実現する。
論文 参考訳(メタデータ) (2020-07-23T13:32:47Z) - Density of States Estimation for Out-of-Distribution Detection [69.90130863160384]
DoSEは状態推定器の密度である。
我々は、他の教師なしOOD検出器に対するDoSEの最先端性能を実証する。
論文 参考訳(メタデータ) (2020-06-16T16:06:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。