論文の概要: Biologically-Informed Hybrid Membership Inference Attacks on Generative Genomic Models
- arxiv url: http://arxiv.org/abs/2511.07503v1
- Date: Wed, 12 Nov 2025 01:01:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.369982
- Title: Biologically-Informed Hybrid Membership Inference Attacks on Generative Genomic Models
- Title(参考訳): 生成ゲノミクスモデルに基づく生物学的にインフォームドされたハイブリッドメンバーシップ推論攻撃
- Authors: Asia Belfiore, Jonathan Passerat-Palmbach, Dmitrii Usynin,
- Abstract要約: 本研究は、合成遺伝的変異プロファイルの生成における言語モデル(LM)の利用について検討する。
生体インフォームドハイブリッドメンバーシップ推論攻撃(biHMIA)を導入することで,DPモードのプライバシ保証を実証的に評価する。
実験により, 小型および大型のGPT様モデルの両方が, 小型ゲノミクス用合成変種発生器として有効であることが確認された。
- 参考スコア(独自算出の注目度): 1.7842332554022688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increased availability of genetic data has transformed genomics research, but raised many privacy concerns regarding its handling due to its sensitive nature. This work explores the use of language models (LMs) for the generation of synthetic genetic mutation profiles, leveraging differential privacy (DP) for the protection of sensitive genetic data. We empirically evaluate the privacy guarantees of our DP modes by introducing a novel Biologically-Informed Hybrid Membership Inference Attack (biHMIA), which combines traditional black box MIA with contextual genomics metrics for enhanced attack power. Our experiments show that both small and large transformer GPT-like models are viable synthetic variant generators for small-scale genomics, and that our hybrid attack leads, on average, to higher adversarial success compared to traditional metric-based MIAs.
- Abstract(参考訳): 遺伝データの可用性の向上はゲノム研究を変革させたが、その繊細な性質のため、その扱いに関して多くのプライバシー上の懸念を提起した。
本研究は, 合成遺伝的変異プロファイルの生成に言語モデル(LM)を用い, 機密遺伝データの保護に差分プライバシ(DP)を活用することを目的とする。
従来のブラックボックスMIAとコンテキストゲノミクスのメトリクスを組み合わせて攻撃力を増強する,生体情報を用いたハイブリッドメンバーシップ推論攻撃(biHMIA)を導入することで,DPモードのプライバシ保証を実証的に評価する。
実験の結果,GPT様モデルと小型変圧器モデルの両方が,小型ゲノミクスのための合成変圧器として有効であることが確認された。
関連論文リスト
- Deep Generative Models for Discrete Genotype Simulation [2.1880699665839396]
本研究では,非条件と表現型条件の両方でジェノタイプデータを生成することを検討する。
可変オートエンコーダ(VAE)、拡散モデル、GAN(Generative Adversarial Networks)などの一般的な生成モデルを開発し評価した。
以上の結果から,これらのモデルが遺伝的パターンを効果的に捉え,遺伝子型・フェノタイプ関連を保存できることが示唆された。
論文 参考訳(メタデータ) (2025-08-11T11:56:03Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - A Game-Theoretic Approach to Privacy-Utility Tradeoff in Sharing Genomic Summary Statistics [24.330984323956173]
本稿では,ゲノムサマリー統計の共有において,最適なプライバシ・ユーティリティ・トレードオフのためのゲーム理論フレームワークを提案する。
実験により,提案手法は,技術状況よりも強力な攻撃と強力な防衛戦略をもたらすことが示された。
論文 参考訳(メタデータ) (2024-06-03T22:09:47Z) - Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [3.972930262155919]
本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。
我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文 参考訳(メタデータ) (2024-05-09T09:34:51Z) - FGBERT: Function-Driven Pre-trained Gene Language Model for Metagenomics [46.189419603576084]
FGBERTは、タンパク質に基づく遺伝子表現を文脈認識トークン化剤として利用する、新しいメダゲノミクス事前訓練モデルである。
これは、遺伝子、機能、細菌、環境レベルにまたがる4つのレベルでのメダゲノミクスデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-24T13:13:17Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures [0.0]
がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
論文 参考訳(メタデータ) (2023-05-01T07:16:40Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。