論文の概要: Conditional canonical correlation estimation based on covariates with
random forests
- arxiv url: http://arxiv.org/abs/2011.11555v2
- Date: Wed, 3 Feb 2021 22:55:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 03:14:40.349032
- Title: Conditional canonical correlation estimation based on covariates with
random forests
- Title(参考訳): ランダム森林との共変量に基づく条件付き標準相関推定
- Authors: Cansu Alakus, Denis Larocque, Sebastien Jacquemont, Fanny Barlaam,
Charles-Olivier Martin, Kristian Agbogba, Sarah Lippe, Aurelie Labbe
- Abstract要約: 本研究では,2つの変数間の条件付き正準相関を推定するRFCCAを用いたランダムフォレスト(Random Forest)を提案する。
提案手法と大域的意義試験は,精度の高い正準相関推定とよく制御されたType-1誤差を提供するシミュレーション研究によって評価される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Investigating the relationships between two sets of variables helps to
understand their interactions and can be done with canonical correlation
analysis (CCA). However, the correlation between the two sets can sometimes
depend on a third set of covariates, often subject-related ones such as age,
gender, or other clinical measures. In this case, applying CCA to the whole
population is not optimal and methods to estimate conditional CCA, given the
covariates, can be useful. We propose a new method called Random Forest with
Canonical Correlation Analysis (RFCCA) to estimate the conditional canonical
correlations between two sets of variables given subject-related covariates.
The individual trees in the forest are built with a splitting rule specifically
designed to partition the data to maximize the canonical correlation
heterogeneity between child nodes. We also propose a significance test to
detect the global effect of the covariates on the relationship between two sets
of variables. The performance of the proposed method and the global
significance test is evaluated through simulation studies that show it provides
accurate canonical correlation estimations and well-controlled Type-1 error. We
also show an application of the proposed method with EEG data.
- Abstract(参考訳): 2つの変数間の関係を調べることは、それらの相互作用を理解するのに役立ち、正準相関解析(CCA)で行うことができる。
しかし、2つのセット間の相関関係は、しばしば年齢、性別、その他の臨床指標といった主題に関連した3つ目の共変量に依存することがある。
この場合、CCAを全人口に適用することは最適ではなく、条件付きCCAを推定する方法が有用である。
そこで本研究では,条件付き正準相関を推定するために,標準相関解析を用いたランダムフォレスト(Random Forest)という手法を提案する。
森の個々の木は、子ノード間の正準相関の不均一性を最大化するためにデータを分割するように特別に設計された分割ルールで構築される。
また,2つの変数間の関係に対する共変量の大域的影響を検出する重要なテストを提案する。
提案手法と大域的意義試験の性能をシミュレーションにより評価し,精度の高い正準相関推定とよく制御されたType-1誤差を提供することを示した。
また,脳波データを用いた提案手法の適用例を示す。
関連論文リスト
- Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [13.12743473333296]
非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文 参考訳(メタデータ) (2024-11-25T12:08:54Z) - Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Covariance regression with random forests [0.0]
CovRegRF は CRAN 上の R パッケージで実装されている。
また,本手法を甲状腺疾患データに適用した。
論文 参考訳(メタデータ) (2022-09-16T21:21:18Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Grouping effects of sparse CCA models in variable selection [6.196334136139173]
可変選択における標準および単純化されたSCCAモデルのグルーピング効果を解析する。
我々の理論的分析は、群付き変数選択の場合、単純化されたSCCAが一緒に変数群を選択または選択することを示している。
論文 参考訳(メタデータ) (2020-08-07T22:27:31Z) - Probabilistic Canonical Correlation Analysis for Sparse Count Data [3.1753001245931323]
正準相関解析は2つの連続変数間の関係を探索する重要な手法である。
2つのスパースカウントデータセットの相関と正準相関推定のためのモデルに基づく確率的アプローチを提案する。
論文 参考訳(メタデータ) (2020-05-11T02:19:57Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。