論文の概要: Can Moran Eigenvectors Improve Machine Learning of Spatial Data? Insights from Synthetic Data Validation
- arxiv url: http://arxiv.org/abs/2504.12450v1
- Date: Wed, 16 Apr 2025 19:31:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 14:38:14.746274
- Title: Can Moran Eigenvectors Improve Machine Learning of Spatial Data? Insights from Synthetic Data Validation
- Title(参考訳): モラン固有ベクトルは空間データの機械学習を改善することができるか?
- Authors: Ziqi Li, Zhan Peng,
- Abstract要約: 本稿では,機械学習モデルにおける空間的特徴としてモラン固有ベクトルを用いることの有効性について検討する。
2つの異なる測地をまたいだ空間的変化と非線形効果を含む既知のプロセスを含む合成データセットを生成する。
その結果、位置座標のみを用いた機械学習モデルは、様々な実験やデータセットにまたがる固有ベクトルに基づくアプローチよりも精度が高いことがわかった。
- 参考スコア(独自算出の注目度): 2.9388890036358104
- License:
- Abstract: Moran Eigenvector Spatial Filtering (ESF) approaches have shown promise in accounting for spatial effects in statistical models. Can this extend to machine learning? This paper examines the effectiveness of using Moran Eigenvectors as additional spatial features in machine learning models. We generate synthetic datasets with known processes involving spatially varying and nonlinear effects across two different geometries. Moran Eigenvectors calculated from different spatial weights matrices, with and without a priori eigenvector selection, are tested. We assess the performance of popular machine learning models, including Random Forests, LightGBM, XGBoost, and TabNet, and benchmark their accuracies in terms of cross-validated R2 values against models that use only coordinates as features. We also extract coefficients and functions from the models using GeoShapley and compare them with the true processes. Results show that machine learning models using only location coordinates achieve better accuracies than eigenvector-based approaches across various experiments and datasets. Furthermore, we discuss that while these findings are relevant for spatial processes that exhibit positive spatial autocorrelation, they do not necessarily apply when modeling network autocorrelation and cases with negative spatial autocorrelation, where Moran Eigenvectors would still be useful.
- Abstract(参考訳): Moran Eigenvector Spatial Filtering (ESF) アプローチは、統計モデルにおける空間効果を考慮に入れている。
これは機械学習に拡張できますか?
本稿では,機械学習モデルにおける空間的特徴としてモラン固有ベクトルを用いることの有効性について検討する。
2つの異なる測地をまたいだ空間的変化と非線形効果を含む既知のプロセスを含む合成データセットを生成する。
異なる空間重み行列から算出したモラン固有ベクトルを、先行固有ベクトル選択の有無で試験する。
我々は、Random Forests、LightGBM、XGBoost、TabNetなどの一般的な機械学習モデルの性能を評価し、それらの精度を、座標のみを特徴として使用するモデルに対してクロスバリデーションされたR2値でベンチマークする。
また、GeoShapleyを用いてモデルから係数や関数を抽出し、実際のプロセスと比較する。
その結果、位置座標のみを用いた機械学習モデルは、様々な実験やデータセットにまたがる固有ベクトルに基づくアプローチよりも精度が高いことがわかった。
さらに,これらの知見は空間自己相関を示す空間過程に関係するが,ネットワーク自己相関のモデル化や,モラン固有ベクトルが有用である負の空間自己相関のケースでは必ずしも適用されない。
関連論文リスト
- Deep Generative model that uses physical quantities to generate and retrieve solar magnetic active regions [0.0]
我々は3種類の機械学習モデルを統合し、物理的に解釈可能な方法で太陽磁気パッチを生成する。
スペースウェザーHMIアクティブリージョンパッチからの磁界測定を用いてGAN(Generative Adversarial Network)のトレーニングを行う。
GAN-SVMの組み合わせにより、ユーザーは所定の物理量でのみスムーズに変化する高品質なパッチを作成できる。
論文 参考訳(メタデータ) (2025-02-07T21:44:01Z) - MUSO: Achieving Exact Machine Unlearning in Over-Parameterized Regimes [19.664090734076712]
マシン・アンラーニング(MU)は、訓練されたモデルを特定のデータでトレーニングされたことがないかのように振る舞う。
本研究では,学習と学習のタスクを統一する交互最適化アルゴリズムを提案する。
このアルゴリズムの有効性は、数値実験によって確認され、様々なシナリオにおける未学習における優れた性能を強調している。
論文 参考訳(メタデータ) (2024-10-11T06:17:17Z) - Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient [52.2669490431145]
PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
論文 参考訳(メタデータ) (2024-05-28T11:30:19Z) - Learning Active Subspaces and Discovering Important Features with Gaussian Radial Basis Functions Neural Networks [0.0]
モデルの訓練が完了すると抽出できる精度行列のスペクトルに含まれる貴重な情報を示す。
回帰,分類,特徴選択タスクの数値実験を行った。
その結果,提案モデルが競合モデルに比べて魅力的な予測性能が得られるだけでなく,予測性能も向上することが示唆された。
論文 参考訳(メタデータ) (2023-07-11T09:54:30Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Benchmarking Learning Efficiency in Deep Reservoir Computing [23.753943709362794]
我々は、機械学習モデルがトレーニングデータからいかに早く学習するかを測定するために、データ効率の指標とともに、ますます困難なタスクのベンチマークを導入する。
我々は、RNN、LSTM、Transformersなどの確立された逐次教師付きモデルの学習速度を、貯水池計算に基づく比較的知られていない代替モデルと比較する。
論文 参考訳(メタデータ) (2022-09-29T08:16:52Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Linear Connectivity Reveals Generalization Strategies [54.947772002394736]
微調整されたモデルのいくつかは、それらの間の線形経路における損失を増大させる大きな障壁を持つ。
テスト損失面上で線形に接続されているが、クラスタ外のモデルから切り離されている異なるモデルのクラスタが見つかる。
我々の研究は、損失面の幾何学がモデルを異なる関数へと導く方法を示している。
論文 参考訳(メタデータ) (2022-05-24T23:43:02Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Learning Self-Expression Metrics for Scalable and Inductive Subspace
Clustering [5.587290026368626]
サブスペースクラスタリングは、高次元データをクラスタリングするための最先端のアプローチとして確立されている。
本研究では,シアムニューラルネットワークアーキテクチャを用いて,サブスペース親和性関数を学習するための新しい距離学習手法を提案する。
我々のモデルは、パラメータの一定数とメモリフットプリントの恩恵を受けており、かなり大きなデータセットにスケールすることができる。
論文 参考訳(メタデータ) (2020-09-27T15:40:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。