論文の概要: Biologically-Informed Hybrid Membership Inference Attacks on Generative Genomic Models
- arxiv url: http://arxiv.org/abs/2511.07503v2
- Date: Fri, 14 Nov 2025 01:56:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 13:23:30.530002
- Title: Biologically-Informed Hybrid Membership Inference Attacks on Generative Genomic Models
- Title(参考訳): 生成ゲノミクスモデルに基づく生物学的にインフォームドされたハイブリッドメンバーシップ推論攻撃
- Authors: Asia Belfiore, Jonathan Passerat-Palmbach, Dmitrii Usynin,
- Abstract要約: 本研究は、合成遺伝的変異プロファイルの生成における言語モデル(LM)の利用について検討する。
生体インフォームドハイブリッドメンバーシップ推論攻撃(biHMIA)を導入することで,DPモードのプライバシ保証を実証的に評価する。
実験により, 小型および大型のGPT様モデルの両方が, 小型ゲノミクス用合成変種発生器として有効であることが確認された。
- 参考スコア(独自算出の注目度): 1.7842332554022688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increased availability of genetic data has transformed genomics research, but raised many privacy concerns regarding its handling due to its sensitive nature. This work explores the use of language models (LMs) for the generation of synthetic genetic mutation profiles, leveraging differential privacy (DP) for the protection of sensitive genetic data. We empirically evaluate the privacy guarantees of our DP modes by introducing a novel Biologically-Informed Hybrid Membership Inference Attack (biHMIA), which combines traditional black box MIA with contextual genomics metrics for enhanced attack power. Our experiments show that both small and large transformer GPT-like models are viable synthetic variant generators for small-scale genomics, and that our hybrid attack leads, on average, to higher adversarial success compared to traditional metric-based MIAs.
- Abstract(参考訳): 遺伝データの可用性の向上はゲノム研究を変革させたが、その繊細な性質のため、その扱いに関して多くのプライバシー上の懸念を提起した。
本研究は, 合成遺伝的変異プロファイルの生成に言語モデル(LM)を用い, 機密遺伝データの保護に差分プライバシ(DP)を活用することを目的とする。
従来のブラックボックスMIAとコンテキストゲノミクスのメトリクスを組み合わせて攻撃力を増強する,生体情報を用いたハイブリッドメンバーシップ推論攻撃(biHMIA)を導入することで,DPモードのプライバシ保証を実証的に評価する。
実験の結果,GPT様モデルと小型変圧器モデルの両方が,小型ゲノミクスのための合成変圧器として有効であることが確認された。
関連論文リスト
- Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [3.972930262155919]
本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。
我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文 参考訳(メタデータ) (2024-05-09T09:34:51Z) - FGBERT: Function-Driven Pre-trained Gene Language Model for Metagenomics [46.189419603576084]
FGBERTは、タンパク質に基づく遺伝子表現を文脈認識トークン化剤として利用する、新しいメダゲノミクス事前訓練モデルである。
これは、遺伝子、機能、細菌、環境レベルにまたがる4つのレベルでのメダゲノミクスデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-24T13:13:17Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures [0.0]
がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
論文 参考訳(メタデータ) (2023-05-01T07:16:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。