論文の概要: Variable importance measure for spatial machine learning models with application to air pollution exposure prediction
- arxiv url: http://arxiv.org/abs/2406.01982v1
- Date: Tue, 4 Jun 2024 05:51:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-05 17:50:34.159381
- Title: Variable importance measure for spatial machine learning models with application to air pollution exposure prediction
- Title(参考訳): 空間機械学習モデルの多変数重要度測定と大気汚染暴露予測への応用
- Authors: Si Cheng, Magali N. Blanco, Lianne Sheppard, Ali Shojaie, Adam Szpiro,
- Abstract要約: 本研究の目的は, 大気汚染の健康影響を学習する能力を最大限に活用するために, データのない場所での被験者の大気汚染の予測を行うことである。
これらの課題を、米国国家PM2.5亜種規制データの硫黄(S)と、シアトルの交通関連大気汚染データセットの超微粒子(UFP)の2つのデータセットで解決する。
私たちの重要な貢献は、幅広いモデルの解釈可能かつ同等の尺度に導かれる、変数の重要度に対する一対一のアプローチである。
- 参考スコア(独自算出の注目度): 2.633085745593072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Exposure assessment is fundamental to air pollution cohort studies. The objective is to predict air pollution exposures for study subjects at locations without data in order to optimize our ability to learn about health effects of air pollution. In addition to generating accurate predictions to minimize exposure measurement error, understanding the mechanism captured by the model is another crucial aspect that may not always be straightforward due to the complex nature of machine learning methods, as well as the lack of unifying notions of variable importance. This is further complicated in air pollution modeling by the presence of spatial correlation. We tackle these challenges in two datasets: sulfur (S) from regulatory United States national PM2.5 sub-species data and ultrafine particles (UFP) from a new Seattle-area traffic-related air pollution dataset. Our key contribution is a leave-one-out approach for variable importance that leads to interpretable and comparable measures for a broad class of models with separable mean and covariance components. We illustrate our approach with several spatial machine learning models, and it clearly highlights the difference in model mechanisms, even for those producing similar predictions. We leverage insights from this variable importance measure to assess the relative utilities of two exposure models for S and UFP that have similar out-of-sample prediction accuracies but appear to draw on different types of spatial information to make predictions.
- Abstract(参考訳): 大気汚染コホート研究には大気汚染の評価が不可欠である。
本研究の目的は, 大気汚染の健康影響を学習する能力を最大限に活用するために, データのない場所での被験者の大気汚染の予測を行うことである。
露出測定誤差を最小限に抑えるための正確な予測を生成することに加えて、モデルが捉えたメカニズムを理解することは、機械学習手法の複雑な性質と、変数の重要性の統一概念の欠如により、必ずしも簡単ではない重要な側面である。
これは空間相関の存在による大気汚染モデリングにおいてさらに複雑である。
これらの課題を、米国国家PM2.5亜種規制データの硫黄(S)と、シアトルの交通関連大気汚染データセットの超微粒子(UFP)の2つのデータセットで解決する。
我々の重要な貢献は、変数の重要度を保留するアプローチであり、分離可能な平均と共分散成分を持つ幅広いモデルの解釈可能かつ同等の尺度をもたらす。
提案手法を空間機械学習モデルを用いて説明し, 類似した予測を行う場合であっても, モデルメカニズムの違いを明確に示す。
我々は,SとUFPの2つの露光モデルに対して,類似のサンプル外予測精度を持つが,異なる種類の空間情報に基づいて予測を行うような相対的実用性を評価するために,この変動重要度尺度からの洞察を利用する。
関連論文リスト
- Stratospheric aerosol source inversion: Noise, variability, and uncertainty quantification [0.0]
本稿では,ベイズ近似誤差を用いた成層圏エアロゾル源インバージョンのためのフレームワークを提案する。
我々はE3SM(Energy Exascale Earth System Model)を用いた特別設計地球モデルシミュレーションを活用する。
データ生成、データ処理、次元削減、演算子学習、ベイズ反転のための包括的なフレームワークについて述べる。
論文 参考訳(メタデータ) (2024-09-10T20:12:36Z) - Machine Learning for Methane Detection and Quantification from Space -- A survey [49.7996292123687]
メタン (CH_4) は強力な温室効果ガスであり、20年間で二酸化炭素 (CO_2) の86倍の温暖化に寄与する。
この研究は、ショートウェーブ赤外線(SWIR)帯域におけるメタン点源検出センサの既存の情報を拡張する。
従来の機械学習(ML)アプローチと同様に、最先端の技術をレビューする。
論文 参考訳(メタデータ) (2024-08-27T15:03:20Z) - Cluster-Segregate-Perturb (CSP): A Model-agnostic Explainability Pipeline for Spatiotemporal Land Surface Forecasting Models [5.586191108738564]
本稿では、LIMEのような摂動に基づく説明可能性手法とPDPのようなグローバルな限界説明可能性の両方から原理を統合するパイプラインを提案する。
提案したパイプラインは,複雑な陸面予測モデルにおける限界感度解析,限界相関解析,ラグ解析などの多様な調査分析の実施を単純化する。
論文 参考訳(メタデータ) (2024-08-12T04:29:54Z) - Urban Air Pollution Forecasting: a Machine Learning Approach leveraging Satellite Observations and Meteorological Forecasts [0.11249583407496218]
大気汚染は公衆衛生、特に都市部において重大な脅威となる。
本研究では, センチネル5P衛星のデータ, 気象条件, トポロジカル特性を統合し, 5つの主要な汚染物質の将来レベルを予測する機械学習モデルを提案する。
論文 参考訳(メタデータ) (2024-05-30T10:02:53Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Observation-Guided Meteorological Field Downscaling at Station Scale: A
Benchmark and a New Method [66.80344502790231]
気象学的ダウンスケーリングを任意の散乱ステーションスケールに拡張し、新しいベンチマークとデータセットを確立する。
データ同化技術にインスパイアされた我々は、観測データをダウンスケーリングプロセスに統合し、マルチスケールの観測先行情報を提供する。
提案手法は、複数の曲面変数上で、他の特別に設計されたベースラインモデルよりも優れている。
論文 参考訳(メタデータ) (2024-01-22T14:02:56Z) - A Framework for Scalable Ambient Air Pollution Concentration Estimation [0.0]
英国では大気汚染が重要な問題であり、大気汚染濃度のデータが大気質の改善を目的とした介入の基礎となっている。
欠落した測度を埋めることにより,時間的・空間的データギャップに対処するデータ駆動型機械学習モデルフレームワークを提案する。
このアプローチは、2018年を通してイングランドの包括的なデータセットを1kmx1kmの時間分解能で提供する。
論文 参考訳(メタデータ) (2024-01-16T18:03:07Z) - Residual Corrective Diffusion Modeling for Km-scale Atmospheric Downscaling [58.456404022536425]
気象・気候からの物理的危険予知技術の現状には、粗い解像度のグローバルな入力によって駆動される高価なkmスケールの数値シミュレーションが必要である。
ここでは、コスト効率のよい機械学習代替手段として、このようなグローバルな入力をkmスケールにダウンスケールするために、生成拡散アーキテクチャを探索する。
このモデルは、台湾上空の地域気象モデルから2kmのデータを予測するために訓練され、世界25kmの再解析に基づいている。
論文 参考訳(メタデータ) (2023-09-24T19:57:22Z) - Robust detection and attribution of climate change under interventions [4.344839102717429]
フィンガープリントは気候変動の検出と属性(D&A)の鍵となるツールである
本稿では,教師付き学習に基づく直接D&A手法を提案し,頑健な予測につながる指紋を抽出する。
本研究は, 関連する介入に対するロバスト性制約を組み込むことは, 気候変動の検出と帰属に有益であることが示唆された。
論文 参考訳(メタデータ) (2022-12-09T15:13:40Z) - Spatial machine-learning model diagnostics: a model-agnostic
distance-based approach [91.62936410696409]
本研究は,空間予測誤差プロファイル (SPEP) と空間変数重要度プロファイル (SVIP) を,新しいモデルに依存しない評価・解釈ツールとして提案する。
統計学的手法、線形モデル、ランダムフォレスト、ハイブリッドアルゴリズムのSPEPとSVIPは、顕著な差異と関連する類似性を示している。
この新しい診断ツールは空間データ科学のツールキットを充実させ、MLモデルの解釈、選択、設計を改善する可能性がある。
論文 参考訳(メタデータ) (2021-11-13T01:50:36Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。