論文の概要: SynthGuard: Redefining Synthetic Data Generation with a Scalable and Privacy-Preserving Workflow Framework
- arxiv url: http://arxiv.org/abs/2507.10489v1
- Date: Mon, 14 Jul 2025 17:11:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:25.568007
- Title: SynthGuard: Redefining Synthetic Data Generation with a Scalable and Privacy-Preserving Workflow Framework
- Title(参考訳): SynthGuard: スケーラブルでプライバシ保護のワークフローフレームワークによる合成データ生成の再定義
- Authors: Eduardo Brito, Mahmoud Shoush, Kristian Tamm, Paula Etti, Liina Kamm,
- Abstract要約: 医療、金融、法執行機関などの分野におけるデータ駆動型アプリケーションへの依存が高まり、データ生成と共有のためのセキュアでプライバシ保護、スケーラブルなメカニズムの必要性が浮き彫りになっている。
我々は、データ所有者が合成データの制御を維持できるようにすることにより、計算ガバナンスを保証するために設計されたフレームワークであるSynthGuardを紹介する。
- 参考スコア(独自算出の注目度): 0.873811641236639
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The growing reliance on data-driven applications in sectors such as healthcare, finance, and law enforcement underscores the need for secure, privacy-preserving, and scalable mechanisms for data generation and sharing. Synthetic data generation (SDG) has emerged as a promising approach but often relies on centralized or external processing, raising concerns about data sovereignty, domain ownership, and compliance with evolving regulatory standards. To overcome these issues, we introduce SynthGuard, a framework designed to ensure computational governance by enabling data owners to maintain control over SDG workflows. SynthGuard supports modular and privacy-preserving workflows, ensuring secure, auditable, and reproducible execution across diverse environments. In this paper, we demonstrate how SynthGuard addresses the complexities at the intersection of domain-specific needs and scalable SDG by aligning with requirements for data sovereignty and regulatory compliance. Developed iteratively with domain expert input, SynthGuard has been validated through real-world use cases, demonstrating its ability to balance security, privacy, and scalability while ensuring compliance. The evaluation confirms its effectiveness in implementing and executing SDG workflows and integrating privacy and utility assessments across various computational environments.
- Abstract(参考訳): 医療、金融、法執行機関などの分野におけるデータ駆動型アプリケーションへの依存が高まり、データ生成と共有のためのセキュアでプライバシ保護、スケーラブルなメカニズムの必要性が浮き彫りになっている。
合成データ生成(SDG)は、有望なアプローチとして現れているが、多くの場合、データ主権、ドメイン所有権、および進化する規制標準への準拠に関する懸念を提起する、中央集権的または外部の処理に依存している。
これらの問題を克服するために、データ所有者がSDGワークフローの制御を維持できるようにすることにより、計算ガバナンスを保証するために設計されたフレームワークであるSynthGuardを紹介した。
SynthGuardは、モジュール化とプライバシ保護のワークフローをサポートし、さまざまな環境にわたってセキュアで監査可能で再現可能な実行を保証する。
本稿では、SynthGuardが、データ主権と規制遵守の要件と整合して、ドメイン固有のニーズと拡張性のあるSDGの共通部分における複雑さにどのように対処するかを実証する。
ドメインエキスパートの入力で反復的に開発されたSynthGuardは、現実のユースケースを通じて検証され、コンプライアンスを確保しつつ、セキュリティ、プライバシ、スケーラビリティのバランスをとる能力を示している。
この評価は、SDGワークフローの実装と実行、および様々な計算環境におけるプライバシとユーティリティアセスメントの統合における有効性を確認する。
関連論文リスト
- Blockchain Powered Edge Intelligence for U-Healthcare in Privacy Critical and Time Sensitive Environment [0.559239450391449]
プライバシクリティカルで時間に敏感な健康アプリケーションのための自律型コンピューティングモデルを提案する。
このシステムは、継続的監視、リアルタイムアラート通知、疾患検出、堅牢なデータ処理と集約をサポートする。
セキュアなアクセススキームは、オフチェーンとオンチェーンのデータ共有とストレージの両方を管理するために定義される。
論文 参考訳(メタデータ) (2025-05-31T06:58:52Z) - Next Generation Authentication for Data Spaces: An Authentication Flow Based On Grant Negotiation And Authorization Protocol For Verifiable Presentations (GNAP4VP) [0.0]
本稿では,データ空間内の共有データ環境に適した認証プロトコルを提案する。
提案したソリューションは、分散化されたユーザ中心のアイデンティティ管理を容易にするために、SSI(Self-Sovereign Identity)の原則に準拠している。
論文 参考訳(メタデータ) (2025-05-30T15:20:39Z) - DP-RTFL: Differentially Private Resilient Temporal Federated Learning for Trustworthy AI in Regulated Industries [0.0]
本稿では,DP-RTFL(Disferially Private Resilient Temporal Federated Learning)を紹介する。
トレーニングの継続性、正確な状態回復、強力なデータプライバシを保証するように設計されている。
このフレームワークは、機密性の高い財務データを使用した信用リスク評価のような重要なアプリケーションに特に適している。
論文 参考訳(メタデータ) (2025-05-27T16:30:25Z) - Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。
FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。
モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文 参考訳(メタデータ) (2025-04-27T04:26:02Z) - MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文 参考訳(メタデータ) (2025-03-17T08:09:42Z) - CaPS: Collaborative and Private Synthetic Data Generation from Distributed Sources [5.898893619901382]
分散データホルダから合成データの協調的かつプライベートな生成のためのフレームワークを提案する。
我々は信頼されたアグリゲータをセキュアなマルチパーティ計算プロトコルに置き換え、差分プライバシー(DP)を介してプライバシを出力する。
MWEM+PGMおよびAIMの最先端選択測度生成アルゴリズムに対するアプローチの適用性とスケーラビリティを実証する。
論文 参考訳(メタデータ) (2024-02-13T17:26:32Z) - Blockchain-empowered Federated Learning for Healthcare Metaverses:
User-centric Incentive Mechanism with Optimal Data Freshness [66.3982155172418]
まず、医療メタバースのための分散型フェデレートラーニング(FL)に基づく、ユーザ中心のプライバシ保護フレームワークを設計する。
次に,情報時代(AoI)を有効データ更新度指標として利用し,観測理論(PT)に基づくAoIベースの契約理論モデルを提案し,センシングデータ共有の動機付けを行う。
論文 参考訳(メタデータ) (2023-07-29T12:54:03Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - Decentralized Stochastic Optimization with Inherent Privacy Protection [103.62463469366557]
分散最適化は、現代の協調機械学習、分散推定と制御、大規模センシングの基本的な構成要素である。
データが関与して以降、分散最適化アルゴリズムの実装において、プライバシ保護がますます重要になっている。
論文 参考訳(メタデータ) (2022-05-08T14:38:23Z) - Distributed Machine Learning and the Semblance of Trust [66.1227776348216]
フェデレートラーニング(FL)により、データ所有者はデータを共有することなく、データガバナンスを維持し、モデルトレーニングをローカルで行うことができる。
FLと関連する技術は、しばしばプライバシー保護と表現される。
この用語が適切でない理由を説明し、プライバシの形式的定義を念頭に設計されていないプロトコルに対する過度な信頼に関連するリスクを概説する。
論文 参考訳(メタデータ) (2021-12-21T08:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。