論文の概要: FPLIER: Federated Pathway-Level Information Extractor
- arxiv url: http://arxiv.org/abs/2605.29587v1
- Date: Thu, 28 May 2026 08:30:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.071964
- Title: FPLIER: Federated Pathway-Level Information Extractor
- Title(参考訳): FPLIER:フェデレーションパスレベル情報エクストラクタ
- Authors: Daniele Malpetti, Christian Berchtold, Francesco Gualdi, Marco Scutari, Laura Azzimonti, Francesca Mangili,
- Abstract要約: 転写学において、遺伝子セット認識因子化法は、大きな不均一な表現コンペンディアを訓練する際に最も効果的である。
本稿では,PLIERのフェデレーション拡張であるFPLIERについて述べる。
- 参考スコア(独自算出の注目度): 0.4104921880358479
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In transcriptomics, gene-set-aware factorization methods such as the Pathway Level Information Extractor (PLIER) are most effective when trained on large, heterogeneous expression compendia. Yet, many clinically relevant cohorts cannot be pooled into a single dataset due to privacy and governance constraints. We present FPLIER, a federated extension of PLIER that enables distributed training across multiple data holders while incorporating publicly available datasets. Through secure aggregation, FPLIER produces training updates algebraically equivalent to those of a centralized pooled-data approach while keeping expression data local. We evaluate FPLIER across multiple scenarios in two simulated consortia (from the K-CLIER and MultiPLIER studies) and demonstrate stable convergence. We further conduct a systematic analysis of membership inference attacks targeting both intermediate training statistics and the released model. Our results show that privacy risk is governed by the rank of the training expression matrix. Incorporating public data or reducing data dimensionality increases this rank, moving the system toward a full-rank regime in which training and non-training samples become indistinguishable to the attacker, and membership-inference performance approaches random guessing.
- Abstract(参考訳): 転写学では、パスウェイレベル情報エクストラクタ(PLIER)のような遺伝子セットを意識した因子分解法が最も効果的である。
しかし、多くの臨床的に関連するコホートは、プライバシとガバナンスの制約のため、単一のデータセットにまとめられません。
本稿では,PLIERのフェデレーション拡張であるFPLIERについて述べる。
セキュアアグリゲーションにより、FPLIERは、表現データをローカルに保ちながら、集中型プールデータアプローチと代数的に等価なトレーニング更新を生成する。
K-CLIERとMultiPLIERの2つの模擬コンソーシアにおける複数のシナリオにおけるFPLIERの評価を行い、安定した収束を示す。
さらに、中間トレーニング統計とリリースモデルの両方を対象として、メンバシップ推論攻撃の系統的解析を行う。
以上の結果から,プライバシリスクはトレーニング式行列のランクによって管理されていることが明らかとなった。
公開データを組み込んだり、データ次元を減らしたりすると、このランクは上昇し、トレーニングや非トレーニングサンプルが攻撃者に区別できないようなフルランクの体制へとシステムを移動させ、メンバーシップ推論性能はランダムな推測にアプローチする。
関連論文リスト
- Data Mixing for Large Language Models Pretraining: A Survey and Outlook [52.66761353708619]
大規模言語モデル(LLM)は、大規模で不均一なコーパスの事前訓練に依存している。
サンプルレベルのデータ選択とは異なり、データミキシングはドメインレベルのサンプリング重量を最適化し、限られた予算をより効率的に割り当てる。
本稿では,LLM事前学習におけるデータ混合の総合的な検討について述べる。
論文 参考訳(メタデータ) (2026-03-25T13:30:40Z) - STSA: Federated Class-Incremental Learning via Spatial-Temporal Statistics Aggregation [64.48462746540156]
Federated Class-Incremental Learning (FCIL)は、分散データからクラスインクリメンタルラーニングを可能にする。
本稿では,空間的(クライアント間)と時間的(ステージ間)の両方に特徴統計を集約する新しい手法を提案する。
本手法は, 性能, 柔軟性, 通信効率の両面で, 最先端のFCIL法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-06-02T05:14:57Z) - Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation [0.0]
因果推論は通常、個々のレベルのデータへの集中的なアクセスを仮定する。
本稿では,フェデレートラーニング(FL)手法を用いて,分散化された観測データから平均処理効果(ATE)を推定することにより,この問題に対処する。
論文 参考訳(メタデータ) (2025-05-23T14:32:57Z) - Probabilistic Federated Prompt-Tuning with Non-IID and Imbalanced Data [35.47385526394076]
微調整事前学習モデルは、適度なデータで複雑なタスクを解決する機械学習の一般的なアプローチである。
事前訓練されたモデル全体を微調整することは、ローカルデータ分布が多様に歪んだフェデレーションデータシナリオでは効果がない。
提案手法は,フェデレーション学習を分散集合モデリングタスクに変換し,事前学習したモデルを世界規模で微調整するための多様なプロンプトを集約する。
論文 参考訳(メタデータ) (2025-02-27T04:31:34Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Distributionally Robust Alignment for Medical Federated Vision-Language Pre-training Under Data Heterogeneity [4.84693589377679]
医用ビジョン言語事前学習のためのFedDRA(Federated Distributionally Robust Alignment)を提案する。
FedDRAは異種条件下で頑健な視覚言語アライメントを実現する。
また,本手法は様々な医学的事前訓練法にも適している。
論文 参考訳(メタデータ) (2024-04-05T01:17:25Z) - FedMM: Federated Multi-Modal Learning with Modality Heterogeneity in
Computational Pathology [3.802258033231335]
Federated Multi-Modal (FedMM) は、複数の単一モード特徴抽出器を訓練し、その後の分類性能を向上させる学習フレームワークである。
FedMMは、精度とAUCメトリクスの2つのベースラインを特に上回っている。
論文 参考訳(メタデータ) (2024-02-24T16:58:42Z) - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [98.26836657967162]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Latent-Variable Advantage-Weighted Policy Optimization for Offline RL [70.01851346635637]
オフラインの強化学習メソッドは、新しいトランジションを環境に問い合わせる必要なしに、事前にコンパイルされたデータセットから学習ポリシーを保証します。
実際には、オフラインデータセットは、しばしば異種、すなわち様々なシナリオで収集される。
より広範な政策分布を表現できる潜在変数ポリシーを活用することを提案する。
提案手法は,次回のオフライン強化学習法の性能を,異種データセット上で49%向上させる。
論文 参考訳(メタデータ) (2022-03-16T21:17:03Z) - An Experimental Study of Data Heterogeneity in Federated Learning
Methods for Medical Imaging [8.984706828657814]
フェデレーション学習は、複数の機関が、プライバシー保護の方法で、ローカルデータ上で機械学習モデルを協調的にトレーニングすることを可能にする。
本研究では,データ不均一性の分類体系が,量スキュー,ラベル分布スキュー,画像取得スキューなどのフェデレーション学習方法に与える影響について検討した。
本稿では,データ量スキューの重み付き平均値,重み付き損失量,ラベル分布スキューのバッチ正規化平均値など,データの不均一性からの性能低下を克服するいくつかの緩和策を提案する。
論文 参考訳(メタデータ) (2021-07-18T05:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。