論文の概要: Controlling for multiple covariates
- arxiv url: http://arxiv.org/abs/2112.00672v1
- Date: Wed, 1 Dec 2021 17:37:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 04:34:10.377603
- Title: Controlling for multiple covariates
- Title(参考訳): 複数共変量に対する制御
- Authors: Mark Tygert
- Abstract要約: 統計学における根本的な問題は、サブ集団のメンバーが達成した結果を比較することである。
比較は、特定の特徴に応じて類似した個人に対して別々に行う場合に最も理にかなっている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A fundamental problem in statistics is to compare the outcomes attained by
members of subpopulations. This problem arises in the analysis of randomized
controlled trials, in the analysis of A/B tests, and in the assessment of
fairness and bias in the treatment of sensitive subpopulations, especially when
measuring the effects of algorithms and machine learning. Often the comparison
makes the most sense when performed separately for individuals who are similar
according to certain characteristics given by the values of covariates of
interest; the separate comparisons can also be aggregated in various ways to
compare across all values of the covariates. Separating, segmenting, or
stratifying into those with similar values of the covariates is also known as
"conditioning on" or "controlling for" those covariates; controlling for age or
annual income is common.
Two standard methods of controlling for covariates are (1) binning and (2)
regression modeling. Binning requires making fairly arbitrary, yet frequently
highly influential choices, and is unsatisfactorily temperamental in multiple
dimensions, with multiple covariates. Regression analysis works wonderfully
when there is good reason to believe in a particular parameterized regression
model or classifier (such as logistic regression). Thus, there appears to be no
extant canonical fully non-parametric regression for the comparison of
subpopulations, not while conditioning on multiple specified covariates.
Existing methods rely on analysts to make choices, and those choices can be
debatable; analysts can deceive others or even themselves. The present paper
aims to fill the gap, combining two ingredients: (1) recently developed
methodologies for such comparisons that already exist when conditioning on a
single scalar covariate and (2) the Hilbert space-filling curve that maps
continuously from one dimension to multiple dimensions.
- Abstract(参考訳): 統計学における根本的な問題は、サブ集団のメンバーが達成した結果を比較することである。
この問題は、ランダム化比較試験の分析、A/Bテストの分析、および敏感なサブ集団の治療における公平さとバイアスの評価、特にアルゴリズムと機械学習の効果を測定する際に発生する。
比較は、興味の共変数の値によって与えられる特定の特性に類似した個人に対して個別に行われる場合が最も理にかなっているが、異なる比較は、共変数のすべての値を比較するために様々な方法で集約することもできる。
コヴァリエートの類似した値を持つものへの分離、分割、階層化は、これらコヴァリエートの「条件付き」または「制御対象」としても知られ、年齢や年収の制御が一般的である。
共変量制御の標準的な方法は、(1)ビンニングと(2)回帰モデリングである。
ビンニングには、かなり任意で、しかし、しばしば非常に影響力のある選択が必要であり、複数の共変量を持つ多次元において不満足に温和である。
回帰分析は、特定のパラメータ化された回帰モデルや分類器(ロジスティック回帰など)を信じる正当な理由がある場合、素晴らしい働きをします。
したがって、複数の特定の共変体に条件付けされている間ではなく、サブポピュレーションの比較のための既存の正準完全非パラメトリック回帰は存在しない。
既存のメソッドはアナリストに頼って選択をし、それらの選択は議論の余地があり、アナリストは他人や自分自身を騙すことができる。
本論文は,(1)単一スカラー共変量体上の条件付け時に既に存在するような比較手法,(2)一次元から多次元へ連続的に写像するヒルベルト空間充填曲線の2つの成分を組み合わせることで,このギャップを埋めることを目的としている。
関連論文リスト
- Gower's similarity coefficients with automatic weight selection [0.0]
混合型変数に対する最も一般的な相似性は、ゴーワーの類似性係数の1つを補うものとして導かれる。
重み付けスキームに関する議論は、しばしば非重み付けの「標準」設定が全体の相似性に対する単一の変数の不均衡な寄与を隠すことを無視するので、誤解を招くことがある。
この欠点は、各寄与相違性と結果の重み付け相違との相関関係を最小化する重み付けスキームを導入するという最近の考え方に倣って解決される。
論文 参考訳(メタデータ) (2024-01-30T14:21:56Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Logistic Regression Equivalence: A Framework for Comparing Logistic
Regression Models Across Populations [4.518012967046983]
本研究は, 個体群差に対する既定寛容レベルの同値試験が, 推論の精度を高めることを論じる。
診断データについては、等価モデルと等価でないモデルの例を示す。
論文 参考訳(メタデータ) (2023-03-23T15:12:52Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - A graphical method of cumulative differences between two subpopulations [0.0]
本稿では, 比較対象のサブポピュレーションのどのメンバーのスコアも, いずれのサブポピュレーションの他のメンバーのスコアと完全に等しいような共通ケースの手法を開発する。
論文 参考訳(メタデータ) (2021-08-05T14:59:56Z) - For high-dimensional hierarchical models, consider exchangeability of
effects across covariates instead of across datasets [18.74167116981788]
共変量数がデータセット数を超えると,標準慣行は統計性能が劣ることを示す。
統計遺伝学では、最大数百万の遺伝的変異に対して、何千もの個人(責任)に対して数十の形質(データセットを定義する)を抑圧するかもしれません。
代替的な視点を表現した階層モデルを提案する。
論文 参考訳(メタデータ) (2021-07-13T23:23:06Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Conditional canonical correlation estimation based on covariates with
random forests [0.0]
本研究では,2つの変数間の条件付き正準相関を推定するRFCCAを用いたランダムフォレスト(Random Forest)を提案する。
提案手法と大域的意義試験は,精度の高い正準相関推定とよく制御されたType-1誤差を提供するシミュレーション研究によって評価される。
論文 参考訳(メタデータ) (2020-11-23T17:09:46Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。