論文の概要: FHAIM: Fully Homomorphic AIM For Private Synthetic Data Generation
- arxiv url: http://arxiv.org/abs/2602.05838v1
- Date: Thu, 05 Feb 2026 16:28:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:09.037286
- Title: FHAIM: Fully Homomorphic AIM For Private Synthetic Data Generation
- Title(参考訳): FHAIM: プライベートな合成データ生成のための完全同型AIM
- Authors: Mayank Kumar, Qian Lou, Paulo Barreto, Martine De Cock, Sikha Pentyala,
- Abstract要約: FHAIMは、暗号データ上で境界ベースの合成データジェネレータをトレーニングするための、最初の完全同型暗号化フレームワークである。
実証分析の結果,FHAIMは実運用環境を維持しつつ,AIMの性能を維持していることがわかった。
- 参考スコア(独自算出の注目度): 14.382861942609189
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data is the lifeblood of AI, yet much of the most valuable data remains locked in silos due to privacy and regulations. As a result, AI remains heavily underutilized in many of the most important domains, including healthcare, education, and finance. Synthetic data generation (SDG), i.e. the generation of artificial data with a synthesizer trained on real data, offers an appealing solution to make data available while mitigating privacy concerns, however existing SDG-as-a-service workflow require data holders to trust providers with access to private data.We propose FHAIM, the first fully homomorphic encryption (FHE) framework for training a marginal-based synthetic data generator on encrypted tabular data. FHAIM adapts the widely used AIM algorithm to the FHE setting using novel FHE protocols, ensuring that the private data remains encrypted throughout and is released only with differential privacy guarantees. Our empirical analysis show that FHAIM preserves the performance of AIM while maintaining feasible runtimes.
- Abstract(参考訳): データはAIの生命線だが、プライバシーと規制のために、最も価値のあるデータはサイロに閉じ込められている。
その結果、AIは医療、教育、ファイナンスなど、最も重要な領域の多くにおいて、依然として過小評価されている。
合成データ生成(SDG)、すなわち、実データに基づいてトレーニングされたシンセサイザーによる人工データの生成は、プライバシの懸念を緩和しながらデータを利用可能にするための魅力的なソリューションを提供するが、既存のSDG-as-a-serviceワークフローでは、データ保持者がプライベートデータにアクセス可能なプロバイダを信頼する必要がある。
FHAIMは、新しいFHEプロトコルを使用して広く使われているAIMアルゴリズムをFHE設定に適合させ、プライベートデータが暗号化されたままであり、差分プライバシー保証のみでリリースされることを保証する。
実証分析の結果,FHAIMは実運用環境を維持しつつ,AIMの性能を維持していることがわかった。
関連論文リスト
- How to DP-fy Your Data: A Practical Guide to Generating Synthetic Data With Differential Privacy [52.00934156883483]
Differential Privacy(DP)は、情報漏洩を推論し、制限するフレームワークである。
Differentially Private Synthetic Dataは、ソースデータの全体的なトレンドを保存する合成データを指す。
論文 参考訳(メタデータ) (2025-12-02T21:14:39Z) - Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T22:53:09Z) - FewFedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning [54.26614091429253]
フェデレーション・インストラクション・チューニング(FedIT)は、複数のデータ所有者間で協調的なトレーニングを統合することで、有望なソリューションである。
FedITは、インストラクショナルデータの不足や、トレーニングデータ抽出攻撃への露出リスクなどの制限に直面している。
本稿では,FewFedPITを提案する。このFewFedPITは,フェデレートされた数ショット学習のプライバシー保護とモデル性能を同時に向上する。
論文 参考訳(メタデータ) (2024-03-10T08:41:22Z) - Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z) - FLAIM: AIM-based Synthetic Data Generation in the Federated Setting [18.38046354606749]
DistAIMとFLAIMは、プライベートデータの統計特性を反映した合成データを作成するために提案されている。
AIMを経口投与することにより,異質性の存在下での実用性は著しく低下する可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-05T10:34:47Z) - Secure Multiparty Computation for Synthetic Data Generation from
Distributed Data [7.370727048591523]
関連データへのアクセスに関する法的および倫理的な制限は、健康、金融、教育といった重要な領域におけるデータ科学の研究を阻害する。
既存のアプローチでは、データ保持者は信頼されたキュレーターに生データを供給し、それを合成データ生成の燃料として利用する。
本稿では,データ保持者が暗号化されたデータのみを差分プライベートな合成データ生成のために共有する,最初のソリューションを提案する。
論文 参考訳(メタデータ) (2022-10-13T20:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。