論文の概要: Logistic Regression Equivalence: A Framework for Comparing Logistic
Regression Models Across Populations
- arxiv url: http://arxiv.org/abs/2303.13330v1
- Date: Thu, 23 Mar 2023 15:12:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 13:48:59.036414
- Title: Logistic Regression Equivalence: A Framework for Comparing Logistic
Regression Models Across Populations
- Title(参考訳): Logistic Regression Equivalence: 人口全体でのロジスティック回帰モデルの比較フレームワーク
- Authors: Guy Ashiri-Prossner, Yuval Benjamini
- Abstract要約: 本研究は, 個体群差に対する既定寛容レベルの同値試験が, 推論の精度を高めることを論じる。
診断データについては、等価モデルと等価でないモデルの例を示す。
- 参考スコア(独自算出の注目度): 4.518012967046983
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we discuss how to evaluate the differences between fitted
logistic regression models across sub-populations. Our motivating example is in
studying computerized diagnosis for learning disabilities, where
sub-populations based on gender may or may not require separate models. In this
context, significance tests for hypotheses of no difference between populations
may provide perverse incentives, as larger variances and smaller samples
increase the probability of not-rejecting the null. We argue that equivalence
testing for a prespecified tolerance level on population differences
incentivizes accuracy in the inference. We develop a cascading set of
equivalence tests, in which each test addresses a different aspect of the
model: the way the phenomenon is coded in the regression coefficients, the
individual predictions in the per example log odds ratio and the overall
accuracy in the mean square prediction error. For each equivalence test, we
propose a strategy for setting the equivalence thresholds. The large-sample
approximations are validated using simulations. For diagnosis data, we show
examples for equivalent and non-equivalent models.
- Abstract(参考訳): 本稿では,サブ人口間の適合ロジスティック回帰モデルの違いを評価する方法について論じる。
私たちのモチベーションは、性別に基づくサブ人口が別々のモデルを必要としない場合、学習障害のコンピュータ診断を研究することである。
この文脈では、集団間の差のない仮説の意義テストは、大きな分散とより小さなサンプルがヌルを消さない確率を増加させるので、逆のインセンティブを与える可能性がある。
本研究は, 個体群差に対する既定寛容レベルの同値試験が, 推論の精度を高めることを論じる。
本研究では,各テストがモデルの異なる側面,すなわち回帰係数における現象の符号化方法,サンプル対数比における個々の予測,平均二乗予測誤差における総合的精度などに対処する等価性テストのカスケードセットを開発する。
各等価テストに対して、等価閾値を設定するための戦略を提案する。
大きなサンプル近似はシミュレーションを用いて検証される。
診断データには等価および非等価モデルの例を示す。
関連論文リスト
- Bayesian Federated Inference for regression models based on non-shared multicenter data sets from heterogeneous populations [0.0]
回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
論文 参考訳(メタデータ) (2024-02-05T11:10:27Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - Benign-Overfitting in Conditional Average Treatment Effect Prediction
with Linear Regression [14.493176427999028]
線形回帰モデルを用いて条件平均処理効果(CATE)の予測における良性過剰適合理論について検討した。
一方,IPW-learnerは確率スコアが分かっていればリスクをゼロに収束させるが,T-learnerはランダムな割り当て以外の一貫性を達成できないことを示す。
論文 参考訳(メタデータ) (2022-02-10T18:51:52Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - A Causal Direction Test for Heterogeneous Populations [10.653162005300608]
ほとんどの因果モデルでは、単一の同質な集団を仮定するが、これは多くの応用において成り立たない仮定である。
等質性仮定に違反した場合、そのような仮定に基づいて開発された因果モデルが正しい因果方向を識別できないことを示す。
我々は,$k$-means型クラスタリングアルゴリズムを用いて,一般的な因果方向検定統計量の調整を提案する。
論文 参考訳(メタデータ) (2020-06-08T18:59:14Z) - Achieving Equalized Odds by Resampling Sensitive Attributes [13.114114427206678]
等価性の概念をほぼ満足する予測モデルを学習するためのフレキシブルなフレームワークを提案する。
この微分可能な関数は、モデルパラメータを等化奇数に向けて駆動するペナルティとして使用される。
本研究は,予測規則が本性質に反するか否かを検出するための公式な仮説テストを開発する。
論文 参考訳(メタデータ) (2020-06-08T00:18:34Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。