論文の概要: Membership Inference Attacks Expose Participation Privacy in ECG Foundation Encoders
- arxiv url: http://arxiv.org/abs/2604.10424v1
- Date: Sun, 12 Apr 2026 02:45:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.007062
- Title: Membership Inference Attacks Expose Participation Privacy in ECG Foundation Encoders
- Title(参考訳): ECGファウンデーションエンコーダの参加プライバシを除外するメンバシップ推論攻撃
- Authors: Ziyu Wang, Elahe Khatibi, Ankita Sharma, Krishnendu Chakrabarty, Sanaz Rahimi Moosavi, Farshad Firouzi, Amir Rahmani,
- Abstract要約: 自己教師付き学習で事前訓練されたファンデーションスタイルのECGエンコーダは、タスク、機関、デプロイメントコンテキストにまたがって再利用されるようになっている。
特定の個人またはコホートが、原波形や診断ラベルが公表されていない場合でも、プレトレーニングにECGデータを寄与したかどうかを、相手は推測できるだろうか?
本稿では,現代の自己管理型ECGファウンデーションエンコーダに対するメンバシップ推論攻撃の実施基盤監査について述べる。
- 参考スコア(独自算出の注目度): 3.4920018472301866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation-style ECG encoders pretrained with self-supervised learning are increasingly reused across tasks, institutions, and deployment contexts, often through model-as-a-service interfaces that expose scalar scores or latent representations. While such reuse improves data efficiency and generalization, it raises a participation privacy concern: can an adversary infer whether a specific individual or cohort contributed ECG data to pretraining, even when raw waveforms and diagnostic labels are never disclosed? In connected-health settings, training participation itself may reveal institutional affiliation, study enrollment, or sensitive health context. We present an implementation-grounded audit of membership inference attacks (MIAs) against modern self-supervised ECG foundation encoders, covering contrastive objectives (SimCLR, TS2Vec) and masked reconstruction objectives (CNN- and Transformer-based MAE). We evaluate three realistic attacker interfaces: (i) score-only black-box access to scalar outputs, (ii) adaptive learned attackers that aggregate subject-level statistics across repeated queries, and (iii) embedding-access attackers that probe latent representation geometry. Using a subject-centric protocol with window-to-subject aggregation and calibration at fixed false-positive rates under a cross-dataset auditing setting, we observe heterogeneous and objective-dependent participation leakage: leakage is most pronounced in small or institution-specific cohorts and, for contrastive encoders, can saturate in embedding space, while larger and more diverse datasets substantially attenuate operational tail risk. Overall, our results show that restricting access to raw signals or labels is insufficient to guarantee participation privacy, underscoring the need for deployment-aware auditing of reusable biosignal foundation encoders in connected-health systems.
- Abstract(参考訳): 自己教師型学習で事前訓練されたファンデーションスタイルのECGエンコーダは、スカラースコアや潜在表現を公開するモデル・アズ・ア・サービスインターフェースを通じて、タスク、機関、デプロイメントのコンテキストで再利用されることが多い。
このような再利用はデータの効率と一般化を改善するが、参加するプライバシーの懸念を生じさせる。特定の個人またはコホートが事前トレーニングに寄与したECGデータを、たとえ生の波形や診断ラベルが明らかにされていないとしても、相手が推測できるのか?
コネクテッドヘルス設定では、トレーニング参加そのものが、制度的なアフィリエイト、研究参加、またはセンシティブな健康状況を明らかにする可能性がある。
本稿では,現代の自己監督型ECGファウンデーションエンコーダに対するMIA(Community Inference attack)の実施と,コントラスト目標(SimCLR,TS2Vec)とマスク再建目標(CNN-およびTransformer-based MAE)について述べる。
3つの現実的なアタッカーインタフェースを評価する。
(i)スカラー出力へのスコアのみのブラックボックスアクセス
(二)繰り返しクエリにまたがる主観レベル統計を集約する適応学習攻撃者、及び
(iii)潜在表現幾何学を探索する埋め込みアクセス攻撃者。
クロスデータセット監査環境下での固定された偽陽性率でのウィンドウ・ツー・オブジェクト・アグリゲーションとキャリブレーションによる対象中心プロトコルを用いて、異種・客観的な参加リークを観察する: 漏洩は、小規模または機関固有のコホートで最も顕著であり、対照的にエンコーダでは、埋め込み空間で飽和し、より大きなデータセットは、運用のテールリスクを著しく軽減する。
以上の結果から, 生信号やラベルへのアクセス制限は, 生体信号基盤エンコーダの配置監査の必要性を浮き彫りにして, 参加者のプライバシを確保するには不十分であることが示唆された。
関連論文リスト
- Key-Embedded Privacy for Decentralized AI in Biomedical Omics [43.072683741556126]
本稿では,Implicit Neural Representation に基づく軽量なフェデレーション学習手法 INFL を提案する。
INFLは、実用性を維持しながら、強力な制御可能なプライバシを実現し、下流の科学および臨床応用のためのユーティリティを保存する。
論文 参考訳(メタデータ) (2026-03-30T12:04:50Z) - CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing [51.56484100374058]
CLAIREは、教師なしの深層表現学習と、スマート製造システムにおけるインテリジェントな品質管理のための教師付き分類を統合したハイブリッドエンドツーエンド学習フレームワークである。
最適化されたディープオートエンコーダを使用して、生の入力をコンパクトな潜伏空間に変換し、不適切な特徴やノイズを抑えながら本質的なデータ構造を効果的にキャプチャする。
提案したフレームワークは、堅牢な障害検出のために、説明可能なAIと機能認識の正規化を統合する可能性を強調している。
論文 参考訳(メタデータ) (2026-03-06T15:11:58Z) - The Hidden Cost of Modeling P(X): Vulnerability to Membership Inference Attacks in Generative Text Classifiers [6.542294761666199]
メンバーシップ推論攻撃(MIA)は、モデルのトレーニングデータセットに特定のサンプルが含まれているかどうかを敵が判断できるようにすることで、重要なプライバシー上の脅威となる。
結合可能性$P(X,Y)$を明示的にモデル化した完全生成型分類器は、メンバシップリークに対して最も脆弱であることを示す。
論文 参考訳(メタデータ) (2025-10-17T18:09:33Z) - Poison to Detect: Detection of Targeted Overfitting in Federated Learning [1.593065406609169]
フェデレートラーニング(FL)は、ローカルデータをプライベートに保ちながら、分散クライアント間で協調的なモデルトレーニングを可能にする。
プライバシーの利点があるにもかかわらず、FLは特定のクライアントをターゲットにしているものを含むプライバシー攻撃に弱いままだ。
本研究では,不正直なオーケストラが意図的にアグリゲーションプロセスを操作し,ターゲットのオーバーフィッティングを誘発する,過度に探索された脅威について検討する。
クライアントがグローバルアグリゲーションの完全性を検証するための3つの検出手法を提案する。
論文 参考訳(メタデータ) (2025-09-15T14:23:39Z) - ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction [57.930531826380836]
本研究は,未ラベル画像のアノテータとして画素レベルの視覚課題におけるラベル不足に,基礎的セグメンテーションモデルが対処できるかどうかを考察する。
ConformalSAMは,まず対象ドメインのラベル付きデータを用いて基礎モデルを校正し,ラベルなしデータの信頼できないピクセルラベルをフィルタリングする新しいSSSSフレームワークである。
論文 参考訳(メタデータ) (2025-07-21T17:02:57Z) - TriCon-SF: A Triple-Shuffle and Contribution-Aware Serial Federated Learning Framework for Heterogeneous Healthcare Data [22.044689597490123]
TriCon-SFは、トリプルシャッフルとコントリビューション意識を統合する新しいシリアル・フェデレーション・ラーニングフレームワークである。
非IIDヘルスケアデータセットの実験では、TriCon-SFが標準シリアルおよび並列フェデレーション学習を精度と通信効率の両方で上回っていることが示されている。
論文 参考訳(メタデータ) (2025-06-20T03:40:35Z) - Securing Genomic Data Against Inference Attacks in Federated Learning Environments [0.31570310818616687]
Federated Learning(FL)は、直接的なデータ共有なしに、分散されたゲノムデータセット間で機械学習モデルを協調的にトレーニングする、有望なフレームワークを提供する。
このアプローチはデータの局所性を保っているが、個人のプライバシーを侵害する可能性のある高度な推論攻撃の影響を受けやすい。
本研究では,合成ゲノムデータを用いてフェデレートされた学習環境をシミュレートし,その脆弱性を3つの攻撃ベクトルに評価する。
論文 参考訳(メタデータ) (2025-05-12T02:36:50Z) - ReCaLL: Membership Inference via Relative Conditional Log-Likelihoods [56.073335779595475]
本稿ではReCaLL(Relative Conditional Log-Likelihood)を提案する。
実験の結果,非メンバープレフィックスの条件付きメンバーデータは,非メンバーデータと比較してログライクな傾向が著しく低下することがわかった。
我々は総合的な実験を行い、ReCaLLがWikiMIAデータセット上で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-06-23T00:23:13Z) - Client-side Gradient Inversion Against Federated Learning from Poisoning [59.74484221875662]
フェデレートラーニング(FL)により、分散参加者は、データを中央サーバに直接共有することなく、グローバルモデルをトレーニングできる。
近年の研究では、FLは元のトレーニングサンプルの再構築を目的とした勾配反転攻撃(GIA)に弱いことが判明している。
本稿では,クライアント側から起動可能な新たな攻撃手法であるクライアント側中毒性グレーディエント・インバージョン(CGI)を提案する。
論文 参考訳(メタデータ) (2023-09-14T03:48:27Z) - Is Vertical Logistic Regression Privacy-Preserving? A Comprehensive
Privacy Analysis and Beyond [57.10914865054868]
垂直ロジスティック回帰(VLR)をミニバッチ降下勾配で訓練した。
我々は、オープンソースのフェデレーション学習フレームワークのクラスにおいて、VLRの包括的で厳密なプライバシー分析を提供する。
論文 参考訳(メタデータ) (2022-07-19T05:47:30Z) - ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for
Semi-supervised Continual Learning [52.831894583501395]
連続学習は、入力されたデータが完全にラベル付けされていると仮定し、実際のアプリケーションでは適用できないかもしれない。
我々は、条件付き生成逆数ネットワーク(GAN)を用いた分類器を相互に学習するために、識別器整合(ORDisCo)を用いたディープオンライン再生を提案する。
ORDisCo が SSCL の様々な半教師付き学習ベンチマークデータセットで大幅なパフォーマンス向上を達成していることを示します。
論文 参考訳(メタデータ) (2021-01-02T09:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。