論文の概要: Spatial machine-learning model diagnostics: a model-agnostic
distance-based approach
- arxiv url: http://arxiv.org/abs/2111.08478v1
- Date: Sat, 13 Nov 2021 01:50:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 14:55:43.567167
- Title: Spatial machine-learning model diagnostics: a model-agnostic
distance-based approach
- Title(参考訳): 空間機械学習モデル診断 : モデルに依存しない距離ベースアプローチ
- Authors: Alexander Brenning
- Abstract要約: 本研究は,空間予測誤差プロファイル (SPEP) と空間変数重要度プロファイル (SVIP) を,新しいモデルに依存しない評価・解釈ツールとして提案する。
統計学的手法、線形モデル、ランダムフォレスト、ハイブリッドアルゴリズムのSPEPとSVIPは、顕著な差異と関連する類似性を示している。
この新しい診断ツールは空間データ科学のツールキットを充実させ、MLモデルの解釈、選択、設計を改善する可能性がある。
- 参考スコア(独自算出の注目度): 91.62936410696409
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: While significant progress has been made towards explaining black-box
machine-learning (ML) models, there is still a distinct lack of diagnostic
tools that elucidate the spatial behaviour of ML models in terms of predictive
skill and variable importance. This contribution proposes spatial prediction
error profiles (SPEPs) and spatial variable importance profiles (SVIPs) as
novel model-agnostic assessment and interpretation tools for spatial prediction
models with a focus on prediction distance. Their suitability is demonstrated
in two case studies representing a regionalization task in an
environmental-science context, and a classification task from remotely-sensed
land cover classification. In these case studies, the SPEPs and SVIPs of
geostatistical methods, linear models, random forest, and hybrid algorithms
show striking differences but also relevant similarities. Limitations of
related cross-validation techniques are outlined, and the case is made that
modelers should focus their model assessment and interpretation on the intended
spatial prediction horizon. The range of autocorrelation, in contrast, is not a
suitable criterion for defining spatial cross-validation test sets. The novel
diagnostic tools enrich the toolkit of spatial data science, and may improve ML
model interpretation, selection, and design.
- Abstract(参考訳): ブラックボックス機械学習(ML)モデルの説明には大きな進歩があったが、予測スキルと変数の重要性の観点からMLモデルの空間的振る舞いを解明する診断ツールがまだ存在しない。
本研究では,空間予測モデルに対する新しいモデルに依存しない評価と解釈ツールとして,空間予測誤差プロファイル(SPEP)と空間変数重要プロファイル(SVIP)を提案する。
その適合性は,環境科学的な文脈における地域化タスクと,リモートセンシング土地被覆分類による分類タスクの2つのケーススタディで実証された。
これらのケーススタディでは、統計学的手法、線形モデル、ランダムフォレスト、ハイブリッドアルゴリズムのSPEPとSVIPは、顕著な差異を示すが、関連する類似性も示している。
関係するクロスバリデーション手法の限界を概説し、モデル化者はモデル評価と解釈を意図した空間予測地平線に集中すべきであるとする。
対照的に自己相関の範囲は、空間的クロスバリデーションテストセットを定義するのに適した基準ではない。
この新しい診断ツールは空間データ科学のツールキットを充実させ、MLモデルの解釈、選択、設計を改善する可能性がある。
関連論文リスト
- Multi-Scale and Multimodal Species Distribution Modeling [4.022195138381868]
種分布モデル (SDM) は, 発生データと環境変数の分布を予測することを目的としている。
SDMへのディープラーニングの最近の応用は、特に空間データを含む新しい道を可能にしている。
我々はSDMのモジュール構造を開発し、シングルスケールとマルチスケールの両方でスケールの効果をテストする。
GeoLifeCLEF 2023ベンチマークの結果は、マルチモーダルデータとマルチスケール表現の学習を考えると、より正確なモデルが得られることを示している。
論文 参考訳(メタデータ) (2024-11-06T15:57:20Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - Determining Domain of Machine Learning Models using Kernel Density Estimates: Applications in Materials Property Prediction [1.8551396341435895]
我々は,カーネル密度推定を用いたモデル領域の評価手法を開発した。
確立された化学知識に基づく無関係と判断された化学物質群は,本測定値と有意な相違が認められた。
相違性の高い尺度は、モデル性能の低さとモデル不確実性の評価の低さと関連している。
論文 参考訳(メタデータ) (2024-05-28T15:41:16Z) - The CAST package for training and assessment of spatial prediction models in R [0.0]
CASTパッケージとその機能について紹介する。
モデリングワークフローのさまざまなステップを調べて、より信頼性の高い空間予測をサポートするためにCASTをどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-04-10T12:48:10Z) - WEEP: A method for spatial interpretation of weakly supervised CNN models in computational pathology [0.36096289461554343]
モデル解釈のための新しい方法 Wsi rEgion sElection aPproach (WEEP) を提案する。
乳がん計算病理領域における二分分類課題におけるWEEPについて検討した。
論文 参考訳(メタデータ) (2024-03-22T14:32:02Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z) - Transforming Feature Space to Interpret Machine Learning Models [91.62936410696409]
この貢献は、特徴空間変換のレンズを通して機械学習モデルを解釈する新しいアプローチを提案する。
非条件的および条件付きポストホック診断ツールの拡張に使用できる。
提案手法の可能性を実証するために,46特徴のリモートセンシング土地被覆分類の事例研究を行った。
論文 参考訳(メタデータ) (2021-04-09T10:48:11Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - Predicting into unknown space? Estimating the area of applicability of
spatial prediction models [0.0]
モデルのクロスバリデーションエラーが適用される領域として定義する「適用可能性の領域」(AOA)を記述した方法論を提案する。
シミュレーションデータを用いて理想的なしきい値を検証し、AOA内の予測誤差とモデルのクロスバリデーション誤差を比較した。
論文 参考訳(メタデータ) (2020-05-16T10:31:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。