論文の概要: Random forests for binary geospatial data
- arxiv url: http://arxiv.org/abs/2302.13828v2
- Date: Thu, 06 Feb 2025 01:45:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 15:30:40.160101
- Title: Random forests for binary geospatial data
- Title(参考訳): 二元地理空間データのためのランダムフォレスト
- Authors: Arkajyoti Saha, Abhirup Datta,
- Abstract要約: 既存のバイナリデータに対するランダムフォレストの実装では、地理空間や時系列設定に共通するデータ相関を明示的に説明することはできない。
最近の研究は、一般化最小二乗損失(GLS)を用いた空間共分散を含むランダム森林(RF)をRF-GLSに拡張している。
二進データの場合、GLS損失はGiniの不純物測度の拡張であり、後者は通常の最小二乗損失(OLS)と全く同じである。
一般化された第1段階からの平均関数のRF-GLS推定を組み込む新しいリンク変換手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The manuscript develops new method and theory for non-linear regression for binary dependent data using random forests. Existing implementations of random forests for binary data cannot explicitly account for data correlation common in geospatial and time-series settings. For continuous outcomes, recent work has extended random forests (RF) to RF-GLS that incorporate spatial covariance using the generalized least squares (GLS) loss. However, adoption of this idea for binary data is challenging due to the use of the Gini impurity measure in classification trees, which has no known extension to model dependence. We show that for binary data, the GLS loss is also an extension of the Gini impurity measure, as the latter is exactly equivalent to the ordinary least squares (OLS) loss. This justifies using RF-GLS for non-parametric mean function estimation for binary dependent data. We then consider the special case of generalized mixed effects models, the traditional statistical model for binary geospatial data, which models the spatial random effects as a Gaussian process (GP). We propose a novel link-inversion technique that embeds the RF-GLS estimate of the mean function from the first step within the generalized mixed effects model framework, enabling estimation of non-linear covariate effects and offering spatial predictions. We establish consistency of our method, RF-GP, for both mean function and covariate effect estimation. The theory holds for a general class of stationary absolutely regular dependent processes that includes common choices like Gaussian processes with Mat\'ern or compactly supported covariances and autoregressive processes. The theory relaxes the common assumption of additive mean functions and accounts for the non-linear link. We demonstrate that RF-GP outperforms competing methods for estimation and prediction in both simulated and real-world data.
- Abstract(参考訳): ランダムフォレストを用いた2値依存データに対する非線形回帰の新しい手法と理論を開発した。
既存のバイナリデータに対するランダムフォレストの実装では、地理空間や時系列設定で共通するデータ相関を明示的に説明することはできない。
連続的な結果を得るために、最近の研究は、一般化最小二乗損失(GLS)を用いた空間共分散を含むランダム森林(RF)をRF-GLSに拡張した。
しかし、このアイデアをバイナリデータに適用することは、モデル依存の既知の拡張を持たない分類木にジニ不純物測度を用いることによって困難である。
二進データの場合、GLS損失はGiniの不純物測度の拡張であり、後者は通常の最小二乗損失(OLS)と全く同じである。
これは、バイナリ依存データに対する非パラメトリック平均関数推定にRF-GLSを用いることを正当化する。
次に、空間ランダム効果をガウス過程(GP)としてモデル化する二元空間データに対する従来の統計モデルである一般化混合効果モデルの特別な場合を考える。
一般化された混合効果モデルフレームワークにおいて、RF-GLS平均関数推定を第1段階から組み込んで、非線形共変量効果の推定と空間予測を可能にする新しいリンク・インバージョン手法を提案する。
我々は,平均関数と共変量効果推定の両方に対して,提案手法RF-GPの整合性を確立する。
この理論は、Mat\'ernによるガウス過程やコンパクトに支持された共分散や自己回帰過程のような共通の選択を含む、定常絶対正則な従属過程の一般的なクラスに当てはまる。
この理論は加法平均関数の一般的な仮定を緩和し、非線形リンクを説明できる。
RF-GPはシミュレーションデータと実世界のデータの両方において、推定と予測の競合する手法より優れていることを示す。
関連論文リスト
- Learning sparse generalized linear models with binary outcomes via iterative hard thresholding [15.283757486793226]
統計学において、一般化線形モデル(GLM)はデータモデリングに広く用いられている。
本稿では,2次反復型ハードしきい値(BIHT)と呼ばれる反復型ハードしきい値(ReLU損失に対する投射勾配勾配)アルゴリズムの使用と解析を提案する。
BIHTは統計的に効率的であり、スパースバイナリGLMの一般クラスにおいてパラメータ推定のための正しい解に収束することを示す。
論文 参考訳(メタデータ) (2025-02-25T17:42:33Z) - Robust Gaussian Processes via Relevance Pursuit [17.39376866275623]
本稿では,データポイント固有ノイズレベルを推定することにより,スパースアウトレーヤに対するロバスト性を実現するGPモデルを提案する。
我々は,データポイント固有ノイズ分散において,関連する対数限界確率が強く抑制されるようなパラメータ化が可能であることを,驚くべきことに示している。
論文 参考訳(メタデータ) (2024-10-31T17:59:56Z) - On the Wasserstein Convergence and Straightness of Rectified Flow [54.580605276017096]
Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文 参考訳(メタデータ) (2024-10-19T02:36:11Z) - Sparse Variational Contaminated Noise Gaussian Process Regression with Applications in Geomagnetic Perturbations Forecasting [4.675221539472143]
大規模なデータセットに正規ノイズが汚染されたスパースガウス過程回帰モデルを適用するためのスケーラブルな推論アルゴリズムを提案する。
提案手法は, 人工ニューラルネットワークベースラインと比較して, 類似のカバレッジと精度の予測間隔が短いことを示す。
論文 参考訳(メタデータ) (2024-02-27T15:08:57Z) - Joint Bayesian Inference of Graphical Structure and Parameters with a
Single Generative Flow Network [59.79008107609297]
本稿では,ベイジアンネットワークの構造上の結合後部を近似する手法を提案する。
サンプリングポリシが2フェーズプロセスに従う単一のGFlowNetを使用します。
パラメータは後部分布に含まれるため、これは局所確率モデルに対してより柔軟である。
論文 参考訳(メタデータ) (2023-05-30T19:16:44Z) - Neural networks for geospatial data [0.0]
NN-GLSは、GPモデルの非線形平均に対する新しいニューラルネットワーク推定アルゴリズムである。
NN-GLSはグラフニューラルネットワーク(GNN)の特殊型として表現されていることを示す。
理論的には、NN-GLSは不規則に観測された空間相関データプロセスに一貫性があることが示されている。
論文 参考訳(メタデータ) (2023-04-18T17:52:23Z) - ManiFlow: Implicitly Representing Manifolds with Normalizing Flows [145.9820993054072]
正規化フロー(NF)は、複雑な実世界のデータ分布を正確にモデル化することが示されているフレキシブルな明示的な生成モデルである。
摂動分布から標本を与えられた多様体上の最も可能性の高い点を復元する最適化目的を提案する。
最後に、NFsの明示的な性質、すなわち、ログのような勾配とログのような勾配から抽出された表面正規化を利用する3次元点雲に焦点を当てる。
論文 参考訳(メタデータ) (2022-08-18T16:07:59Z) - Gaussian Graphical Models as an Ensemble Method for Distributed Gaussian
Processes [8.4159776055506]
我々はガウスの専門家の予測をガウス図形モデル(GGM)により集約する新しいアプローチを提案する。
まず、予測最大化(EM)アルゴリズムを用いて、潜伏変数と観測変数の合同分布を推定する。
我々の新しい手法は他の最先端のDGP手法よりも優れている。
論文 参考訳(メタデータ) (2022-02-07T15:22:56Z) - Non-Gaussian Gaussian Processes for Few-Shot Regression [71.33730039795921]
乱変数ベクトルの各成分上で動作し,パラメータを全て共有する可逆なODEベースのマッピングを提案する。
NGGPは、様々なベンチマークとアプリケーションに対する競合する最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-10-26T10:45:25Z) - On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。
本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。
理論的にも経験的にも二重降下現象を観察する。
論文 参考訳(メタデータ) (2021-10-13T17:47:39Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z) - Improving predictions of Bayesian neural nets via local linearization [79.21517734364093]
ガウス・ニュートン近似は基礎となるベイズニューラルネットワーク(BNN)の局所線形化として理解されるべきである。
この線形化モデルを後部推論に使用するので、元のモデルではなく、この修正モデルを使用することも予測すべきである。
この修正された予測を"GLM predictive"と呼び、Laplace近似の共通不適合問題を効果的に解決することを示す。
論文 参考訳(メタデータ) (2020-08-19T12:35:55Z) - Random Forests for dependent data [1.5469452301122173]
本稿では,RFの新たな拡張であるRF-GLSを提案する。
この拡張の鍵は、大域的OLS最適化として回帰木における局所的な決定の等価表現である。
RF-GLSによるRFの予測と予測の精度向上を実験的に実証した。
論文 参考訳(メタデータ) (2020-07-30T12:36:09Z) - Deep Gaussian Markov Random Fields [17.31058900857327]
GMRFと畳み込みニューラルネットワーク(CNN)の正式な接続を確立する。
共通GMRFは、データから潜伏変数への逆写像が1層線形CNNによって与えられる生成モデルの特別な場合である。
本稿では,オートディフや変分推論などの確立したツールが,深部GMRFの簡易かつ効率的な推論と学習にどのように利用できるかを述べる。
論文 参考訳(メタデータ) (2020-02-18T10:06:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。