論文の概要: Bayesian Federated Inference for regression models with heterogeneous
multi-center populations
- arxiv url: http://arxiv.org/abs/2402.02898v1
- Date: Mon, 5 Feb 2024 11:10:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 16:48:47.919564
- Title: Bayesian Federated Inference for regression models with heterogeneous
multi-center populations
- Title(参考訳): 不均一多中心集団の回帰モデルに対するベイズ連邦推論
- Authors: Marianne A Jonker, Hassan Pazira, Anthony CC Coolen
- Abstract要約: 回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To estimate accurately the parameters of a regression model, the sample size
must be large enough relative to the number of possible predictors for the
model. In practice, sufficient data is often lacking, which can lead to
overfitting of the model and, as a consequence, unreliable predictions of the
outcome of new patients. Pooling data from different data sets collected in
different (medical) centers would alleviate this problem, but is often not
feasible due to privacy regulation or logistic problems. An alternative route
would be to analyze the local data in the centers separately and combine the
statistical inference results with the Bayesian Federated Inference (BFI)
methodology. The aim of this approach is to compute from the inference results
in separate centers what would have been found if the statistical analysis was
performed on the combined data. We explain the methodology under homogeneity
and heterogeneity across the populations in the separate centers, and give real
life examples for better understanding. Excellent performance of the proposed
methodology is shown. An R-package to do all the calculations has been
developed and is illustrated in this paper. The mathematical details are given
in the Appendix.
- Abstract(参考訳): 回帰モデルのパラメータを正確に推定するには、サンプルサイズがモデルに対する予測値の数に対して十分に大きい必要がある。
実際には、十分なデータが欠如しており、モデルが過剰に適合し、その結果、新しい患者の結果の信頼性の低い予測につながる可能性がある。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティック問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、統計解析が結合データ上で実行された場合の推測結果を、別々のセンタで計算することである。
本研究は,同質性と異質性に基づく方法論を別センターの集団間で説明し,よりよく理解するための実例を与える。
提案手法の優れた性能を示す。
すべての計算を行うRパッケージが開発され,本論文で説明されている。
数学的詳細はAppendixに記載されている。
関連論文リスト
- Federated Causal Inference: Multi-Centric ATE Estimation beyond Meta-Analysis [12.896319628045967]
我々は、中央に分散したデータから治療効果を推定するフェデレート因果推論(Federated Causal Inference)について検討する。
プラグインG-Formulaから得られた平均治療効果(ATE)推定器の3つのクラスを比較した。
論文 参考訳(メタデータ) (2024-10-22T10:19:17Z) - Bayesian Federated Inference for Survival Models [0.0]
がん研究において、全体的な生存と進行の自由生存は、しばしばコックスモデルで分析される。
異なる医療センターのデータセットをマージすることは役に立つかもしれないが、厳格なプライバシー法とロジスティックな困難のために、これは必ずしも可能ではない。
近年,一般化線形モデルに対するベイズ連邦推論(BFI)戦略が提案されている。
論文 参考訳(メタデータ) (2024-04-26T15:05:26Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - PQMass: Probabilistic Assessment of the Quality of Generative Models
using Probability Mass Estimation [8.527898482146103]
生成モデルの品質を評価するための包括的サンプルベース手法を提案する。
提案手法により,同じ分布から2組のサンプルが引き出される確率を推定できる。
論文 参考訳(メタデータ) (2024-02-06T19:39:26Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Logistic Regression Equivalence: A Framework for Comparing Logistic
Regression Models Across Populations [4.518012967046983]
本研究は, 個体群差に対する既定寛容レベルの同値試験が, 推論の精度を高めることを論じる。
診断データについては、等価モデルと等価でないモデルの例を示す。
論文 参考訳(メタデータ) (2023-03-23T15:12:52Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。