論文の概要: Multi-Study Boosting: Theoretical Considerations for Merging vs.
Ensembling
- arxiv url: http://arxiv.org/abs/2207.04588v2
- Date: Wed, 13 Jul 2022 02:29:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 11:34:28.159312
- Title: Multi-Study Boosting: Theoretical Considerations for Merging vs.
Ensembling
- Title(参考訳): マルチスタディブースティング:メルジング対組立の理論的考察
- Authors: Cathy Shyr, Pragya Sur, Giovanni Parmigiani and Prasad Patil
- Abstract要約: クロススタディの再現性は、予測の一般化性を強調する強力なモデル評価基準である。
本研究では, 予測・アウトカム関係における潜在的不均一性の存在下での促進アルゴリズムについて検討した。
我々は,1)すべての学習をマージし,単一のモデルを訓練する,2)マルチスタディ・アンサンブル(multi-study ensembling)という2つのマルチスタディ・ラーニング戦略を比較した。
- 参考スコア(独自算出の注目度): 2.252304836689618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-study replicability is a powerful model evaluation criterion that
emphasizes generalizability of predictions. When training cross-study
replicable prediction models, it is critical to decide between merging and
treating the studies separately. We study boosting algorithms in the presence
of potential heterogeneity in predictor-outcome relationships across studies
and compare two multi-study learning strategies: 1) merging all the studies and
training a single model, and 2) multi-study ensembling, which involves training
a separate model on each study and ensembling the resulting predictions. In the
regression setting, we provide theoretical guidelines based on an analytical
transition point to determine whether it is more beneficial to merge or to
ensemble for boosting with linear learners. In addition, we characterize a
bias-variance decomposition of estimation error for boosting with
component-wise linear learners. We verify the theoretical transition point
result in simulation and illustrate how it can guide the decision on merging
vs. ensembling in an application to breast cancer gene expression data.
- Abstract(参考訳): クロススタディの再現性は、予測の一般化性を強調する強力なモデル評価基準である。
クロススタディレプリカブル予測モデルをトレーニングする場合、研究のマージと処理を別々に決定することが重要である。
我々は,予測・アウトカム関係における潜在的不均一性の存在下での促進アルゴリズムについて研究し,2つのマルチスタディ学習戦略を比較した。
1)すべての研究と訓練を1つのモデルに統合し、
2)マルチスタディ・アンサンブルは,各研究で個別のモデルを訓練し,その結果の予測をアンサンブルする。
回帰設定では,解析的遷移点に基づく理論的指針を提供し,マージがより有益であるか,あるいは線形学習者との協調が重要であるかを判断する。
さらに,成分単位線形学習者によるブースティングのための推定誤差の偏分散分解を特徴付ける。
本研究は, 乳がん遺伝子の発現データに対するマージ対アンサンブルの決定をいかに導くか, シミュレーションによる理論的遷移点の検証を行った。
関連論文リスト
- Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Less is More: Mitigate Spurious Correlations for Open-Domain Dialogue
Response Generation Models by Causal Discovery [52.95935278819512]
本研究で得られたCGDIALOGコーパスに基づくオープンドメイン応答生成モデルのスプリアス相関に関する最初の研究を行った。
因果探索アルゴリズムに着想を得て,反応生成モデルの学習と推論のための新しいモデル非依存手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T06:33:48Z) - A Rationale-Centric Framework for Human-in-the-loop Machine Learning [12.793695970529138]
本稿では,RDL(Ralionales-centric Double-robustness Learning)を用いた新たな理性中心型フレームワークを提案する。
RDLは、有理性(すなわち、予測を引き起こすフレーズ)、人間の介入、半現実的な拡張を利用して、スパイラルな関連性やバイアスモデルを切り離し、一般に適用可能な基礎的分布に向かわせる。
論文 参考訳(メタデータ) (2022-03-24T08:12:57Z) - Benign-Overfitting in Conditional Average Treatment Effect Prediction
with Linear Regression [14.493176427999028]
線形回帰モデルを用いて条件平均処理効果(CATE)の予測における良性過剰適合理論について検討した。
一方,IPW-learnerは確率スコアが分かっていればリスクをゼロに収束させるが,T-learnerはランダムな割り当て以外の一貫性を達成できないことを示す。
論文 参考訳(メタデータ) (2022-02-10T18:51:52Z) - Nonparametric Estimation of Heterogeneous Treatment Effects: From Theory
to Learning Algorithms [91.3755431537592]
プラグイン推定と擬似出力回帰に依存する4つの幅広いメタ学習戦略を解析する。
この理論的推論を用いて、アルゴリズム設計の原則を導出し、分析を実践に翻訳する方法について強調する。
論文 参考訳(メタデータ) (2021-01-26T17:11:40Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。