論文の概要: Transfer Learning with Distance Covariance for Random Forest: Error Bounds and an EHR Application
- arxiv url: http://arxiv.org/abs/2510.10870v1
- Date: Mon, 13 Oct 2025 00:31:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.136208
- Title: Transfer Learning with Distance Covariance for Random Forest: Error Bounds and an EHR Application
- Title(参考訳): ランダム森林における距離共分散を用いた移動学習:誤差境界とEHR応用
- Authors: Chenze Li, Subhadeep Paul,
- Abstract要約: 集中型ランダムフォレスト(CRF)を用いた非パラメトリック回帰における伝達学習手法を提案する。
シミュレーションでは,データ駆動型特徴分割選択を用いた標準ランダムフォレスト (SRF) 法についても数値的に検討した。
本手法は小層病院におけるICU患者の死亡率の予測に有意な効果を示した。
- 参考スコア(独自算出の注目度): 1.6042394978941517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random forest is an important method for ML applications due to its broad outperformance over competing methods for structured tabular data. We propose a method for transfer learning in nonparametric regression using a centered random forest (CRF) with distance covariance-based feature weights, assuming the unknown source and target regression functions are different for a few features (sparsely different). Our method first obtains residuals from predicting the response in the target domain using a source domain-trained CRF. Then, we fit another CRF to the residuals, but with feature splitting probabilities proportional to the sample distance covariance between the features and the residuals in an independent sample. We derive an upper bound on the mean square error rate of the procedure as a function of sample sizes and difference dimension, theoretically demonstrating transfer learning benefits in random forests. In simulations, we show that the results obtained for the CRFs also hold numerically for the standard random forest (SRF) method with data-driven feature split selection. Beyond transfer learning, our results also show the benefit of distance-covariance-based weights on the performance of RF in some situations. Our method shows significant gains in predicting the mortality of ICU patients in smaller-bed target hospitals using a large multi-hospital dataset of electronic health records for 200,000 ICU patients.
- Abstract(参考訳): ランダムフォレスト(Random forest)は、構造化表データに対する競合手法よりも幅広い性能のため、MLアプリケーションにとって重要な手法である。
距離共分散に基づく特徴量を持つ中心ランダム林(CRF)を用いた非パラメトリック回帰における伝達学習法を提案する。
提案手法は,まず,ソース領域を学習したCRFを用いて,対象領域の応答を予測することによって残差を求める。
次に, 残留物に別のCRFを適合させるが, 独立試料中の特徴物と残留物との間の試料距離の共分散に比例した特徴分割確率を持つ。
我々は,ランダム林における移動学習の利点を理論的に示すため,標本サイズと差分次元の関数として,手順の平均2乗誤差率の上限を導出した。
シミュレーションでは,データ駆動型特徴分割選択を用いた標準ランダムフォレスト(SRF)法においても,CRFの結果が数値的に保持されることが示されている。
また, 移動学習以外にも, 距離共分散に基づく重み付けがRFの性能に与える影響が示唆された。
対象病院におけるICU患者の死亡率の予測には,20万人のICU患者を対象とした多院間での電子的健康記録のデータセットが有用であった。
関連論文リスト
- Amortized Posterior Sampling with Diffusion Prior Distillation [55.03585818289934]
Amortized Posterior Smplingは、逆問題における効率的な後方サンプリングのための新しい変分推論手法である。
本手法は,拡散モデルにより暗黙的に定義された変動分布と後続分布とのばらつきを最小限に抑えるために条件付き流れモデルを訓練する。
既存の手法とは異なり、我々のアプローチは教師なしであり、ペア化されたトレーニングデータを必要としておらず、ユークリッドと非ユークリッドの両方のドメインに適用できる。
論文 参考訳(メタデータ) (2024-07-25T09:53:12Z) - Individualized Multi-Treatment Response Curves Estimation using RBF-net with Shared Neurons [1.1119247609126184]
反応曲線の非パラメトリックモデリングは、共有された隠れニューロンを持つ放射基底関数(RBF)-ネットに依存している。
本手法をMIMICデータに適用し, 在宅中絶患者に対するICU滞在時間と12時間SOFAスコアに対する異なる治療方法の効果に関する興味深い知見を得た。
論文 参考訳(メタデータ) (2024-01-29T21:13:01Z) - MMD-based Variable Importance for Distributional Random Forest [5.0459880125089]
分布ランダムフォレスト(DRF)における変数重要度アルゴリズムを提案する。
導入された重要度尺度は一貫性があり、実データと模擬データの両方で高い経験的性能を示し、競合より優れていることを示す。
論文 参考訳(メタデータ) (2023-10-18T17:12:29Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Covariance regression with random forests [0.0]
CovRegRF は CRAN 上の R パッケージで実装されている。
また,本手法を甲状腺疾患データに適用した。
論文 参考訳(メタデータ) (2022-09-16T21:21:18Z) - Sampling-free Variational Inference for Neural Networks with
Multiplicative Activation Noise [51.080620762639434]
サンプリングフリー変動推論のための後方近似のより効率的なパラメータ化を提案する。
提案手法は,標準回帰問題に対する競合的な結果をもたらし,大規模画像分類タスクに適している。
論文 参考訳(メタデータ) (2021-03-15T16:16:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。