論文の概要: Heterogeneous Datasets for Federated Survival Analysis Simulation
- arxiv url: http://arxiv.org/abs/2301.12166v1
- Date: Sat, 28 Jan 2023 11:37:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 18:37:02.016838
- Title: Heterogeneous Datasets for Federated Survival Analysis Simulation
- Title(参考訳): フェデレーションサバイバル解析シミュレーションのための不均一データセット
- Authors: Alberto Archetti, Eugenio Lomurno, Francesco Lattari, Andr\'e Martin,
Matteo Matteucci
- Abstract要約: 本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。
提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
- 参考スコア(独自算出の注目度): 6.489759672413373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Survival analysis studies time-modeling techniques for an event of interest
occurring for a population. Survival analysis found widespread applications in
healthcare, engineering, and social sciences. However, the data needed to train
survival models are often distributed, incomplete, censored, and confidential.
In this context, federated learning can be exploited to tremendously improve
the quality of the models trained on distributed data while preserving user
privacy. However, federated survival analysis is still in its early
development, and there is no common benchmarking dataset to test federated
survival models. This work proposes a novel technique for constructing
realistic heterogeneous datasets by starting from existing non-federated
datasets in a reproducible way. Specifically, we provide two novel
dataset-splitting algorithms based on the Dirichlet distribution to assign each
data sample to a carefully chosen client: quantity-skewed splitting and
label-skewed splitting. Furthermore, these algorithms allow for obtaining
different levels of heterogeneity by changing a single hyperparameter. Finally,
numerical experiments provide a quantitative evaluation of the heterogeneity
level using log-rank tests and a qualitative analysis of the generated splits.
The implementation of the proposed methods is publicly available in favor of
reproducibility and to encourage common practices to simulate federated
environments for survival analysis.
- Abstract(参考訳): 生存分析は、集団に起こる関心事に対する時間モデリング技術を研究する。
生存分析は医療、工学、社会科学に広く応用された。
しかし、生存モデルをトレーニングするために必要なデータは、しばしば分散、不完全、検閲、機密である。
このコンテキストでは、連合学習を活用して、ユーザのプライバシを維持しながら、分散データでトレーニングされたモデルの品質を大幅に向上させることができる。
しかし、フェデレーションサバイバル分析はまだ初期段階であり、フェデレーションサバイバルモデルをテストするための一般的なベンチマークデータセットは存在しない。
本研究では,既存の非フェデレーションデータセットから再現可能な方法で開始することにより,現実的な不均一データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択されたクライアントに割り当てる。
さらに、これらのアルゴリズムは、1つのハイパーパラメータを変更することで異質性の異なるレベルを得ることができる。
最後に, 数値実験により, ログランクテストによる不均一性の定量的評価と, 生成した分割の質的解析が得られた。
提案手法の実装は再現性に賛成し、生存分析のための連帯環境をシミュレートするための一般的な慣行を奨励するために公に利用可能である。
関連論文リスト
- Adaptive Transformer Modelling of Density Function for Nonparametric Survival Analysis [11.35395323124404]
生存分析は、経済学、工学、医療など様々な分野において重要な役割を担っている。
本稿では,従来の分布仮定を使わずに,高品質な単文PDFを作成できる新しい生存回帰手法を提案する。
論文 参考訳(メタデータ) (2024-09-10T04:29:59Z) - Multi-modal Data Binding for Survival Analysis Modeling with Incomplete Data and Annotations [19.560652381770243]
我々は、モダリティと検閲されたサバイバルラベルにまたがる不完全なデータを同時に扱う新しいフレームワークを導入する。
我々のアプローチでは、高度な基礎モデルを用いて個々のモダリティを符号化し、それらを普遍的な表現空間に整列させる。
提案手法は,2つのサバイバル分析タスクにおいて,両者が適用したデータセットの予測精度に優れることを示す。
論文 参考訳(メタデータ) (2024-07-25T02:55:39Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Combining propensity score methods with variational autoencoders for
generating synthetic data in presence of latent sub-groups [0.0]
ヘテロジニティは、例えば、サブグループラベルによって示されるように知られ、あるいは未知であり、双曲性や歪みのような分布の性質にのみ反映されるかもしれない。
本研究では,変分オートエンコーダ(VAE)から合成データを取得する際に,このような異種性をどのように保存し,制御するかを検討する。
論文 参考訳(メタデータ) (2023-12-12T22:49:24Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Tackling Computational Heterogeneity in FL: A Few Theoretical Insights [68.8204255655161]
我々は、計算異種データの形式化と処理を可能にする新しい集約フレームワークを導入し、分析する。
提案するアグリゲーションアルゴリズムは理論的および実験的予測から広範囲に解析される。
論文 参考訳(メタデータ) (2023-07-12T16:28:21Z) - Synthetic data generation for a longitudinal cohort study -- Evaluation,
method extension and reproduction of published data analysis results [0.32593385688760446]
医療分野では、プライバシー上の懸念から個人レベルのデータへのアクセスは困難であることが多い。
有望な代替手段は、完全な合成データの生成である。
本研究では,最先端の合成データ生成手法を用いる。
論文 参考訳(メタデータ) (2023-05-12T13:13:55Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - A Deep Variational Approach to Clustering Survival Data [5.871238645229228]
変分深層クラスタリングにおけるクラスタサバイバルデータに対する新しい確率的アプローチを提案する。
提案手法は,説明変数と潜在的に検閲された生存時間の両方の分布を明らかにするために,深い生成モデルを用いている。
論文 参考訳(メタデータ) (2021-06-10T14:10:25Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。