論文の概要: Statistical inference for case-control logistic regression via integrating external summary data
- arxiv url: http://arxiv.org/abs/2405.20655v1
- Date: Fri, 31 May 2024 07:47:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-03 15:16:48.626515
- Title: Statistical inference for case-control logistic regression via integrating external summary data
- Title(参考訳): 外部要約データの統合によるケース制御ロジスティック回帰の統計的推測
- Authors: Hengchao Shi, Xinyi Liu, Ming Zheng, Wen Yu,
- Abstract要約: ケースコントロールサンプリングは、バイナリデータの不均衡構造を緩和するために一般的に使用される振り返りサンプリング設計である。
内部ケース制御データと外部情報を組み込んでロジスティックモデルを推定するために,実証的可能性に基づくアプローチを提案する。
- 参考スコア(独自算出の注目度): 8.369377566749202
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Case-control sampling is a commonly used retrospective sampling design to alleviate imbalanced structure of binary data. When fitting the logistic regression model with case-control data, although the slope parameter of the model can be consistently estimated, the intercept parameter is not identifiable, and the marginal case proportion is not estimatable, either. We consider the situations in which besides the case-control data from the main study, called internal study, there also exists summary-level information from related external studies. An empirical likelihood based approach is proposed to make inference for the logistic model by incorporating the internal case-control data and external information. We show that the intercept parameter is identifiable with the help of external information, and then all the regression parameters as well as the marginal case proportion can be estimated consistently. The proposed method also accounts for the possible variability in external studies. The resultant estimators are shown to be asymptotically normally distributed. The asymptotic variance-covariance matrix can be consistently estimated by the case-control data. The optimal way to utilized external information is discussed. Simulation studies are conducted to verify the theoretical findings. A real data set is analyzed for illustration.
- Abstract(参考訳): ケースコントロールサンプリングは、バイナリデータの不均衡構造を緩和するために一般的に使用される振り返りサンプリング設計である。
対物論的回帰モデルとケース制御データとを合わせると、モデルの傾きパラメータは一貫して推定できるが、インターセプトパラメータは特定できず、限界ケース比も推定できない。
本研究では,本研究のケースコントロールデータである内科研究に加えて,関連する外部研究の要約レベル情報も検討する。
内部ケース制御データと外部情報を組み込んでロジスティックモデルを推定するために,実証的可能性に基づくアプローチを提案する。
本稿では, インターセプトパラメータが外部情報の助けを借りて識別可能であることを示す。
提案手法は,外部研究における可変性も考慮する。
結果の推定値は漸近的に分布することが示されている。
漸近分散共分散行列はケース制御データにより一貫して推定できる。
外部情報を利用するための最適な方法について議論する。
理論的な結果を検証するためにシミュレーション研究を行った。
実際のデータセットはイラストのために分析される。
関連論文リスト
- Deep non-parametric logistic model with case-control data and external summary information [2.524439717544601]
ケースコントロールサンプリング設計は、バイナリデータで観測される不均衡構造を緩和するための重要な戦略として機能する。
外部要約情報によって補足されたケース制御データを用いた非パラメトリックロジスティックモデルの推定を検討する。
論文 参考訳(メタデータ) (2024-09-03T12:23:09Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Efficient semi-supervised inference for logistic regression under
case-control studies [3.5485531932219243]
ラベル付きデータの結果がバイナリとなる半教師付き設定における推論問題を考える。
ケースコントロールサンプリングは、バイナリデータの不均衡構造を緩和するための効果的なサンプリング手法である。
ラベルのないデータが利用可能であれば、インターセプトパラメータを半教師付き学習設定で識別できることが分かる。
論文 参考訳(メタデータ) (2024-02-23T14:55:58Z) - Extrapolation-Aware Nonparametric Statistical Inference [8.090257544386482]
外挿は多くのデータ分析アプリケーションで起こり、考慮しなければ結果の結論を無効にすることができる。
非パラメトリック統計モデルを拡張して、外挿を明示的に許容し、外挿仮定のクラスを導入する。
論文 参考訳(メタデータ) (2024-02-15T07:16:50Z) - Bayesian Federated Inference for regression models based on non-shared multicenter data sets from heterogeneous populations [0.0]
回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
論文 参考訳(メタデータ) (2024-02-05T11:10:27Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。