Fugu-MT 論文翻訳(概要): Synergizing Privacy and Utility in Data Analytics Through Advanced Information Theorization

論文の概要: Synergizing Privacy and Utility in Data Analytics Through Advanced Information Theorization

arxiv url: http://arxiv.org/abs/2404.16241v1
Date: Wed, 24 Apr 2024 22:58:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-26 15:17:42.263354
Title: Synergizing Privacy and Utility in Data Analytics Through Advanced Information Theorization
Title（参考訳）: 高度な情報理論によるデータ分析におけるプライバシとユーティリティの相乗効果
Authors: Zahir Alsulaimawi,
Abstract要約: 本稿では,高次元画像データに適したノイズ注入技術,ロバストな特徴抽出のための変分オートエンコーダ(VAE),構造化データプライバシに最適化された期待最大化(EM)アプローチの3つの高度なアルゴリズムを紹介する。本手法は,機密属性と変換データ間の相互情報を著しく低減し,プライバシーを向上する。この研究は、さまざまなデータタイプにまたがってプライバシ保護アルゴリズムをデプロイするための柔軟で効果的な戦略を提供することによって、この分野に貢献する。
参考スコア（独自算出の注目度）: 2.28438857884398
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study develops a novel framework for privacy-preserving data analytics, addressing the critical challenge of balancing data utility with privacy concerns. We introduce three sophisticated algorithms: a Noise-Infusion Technique tailored for high-dimensional image data, a Variational Autoencoder (VAE) for robust feature extraction while masking sensitive attributes and an Expectation Maximization (EM) approach optimized for structured data privacy. Applied to datasets such as Modified MNIST and CelebrityA, our methods significantly reduce mutual information between sensitive attributes and transformed data, thereby enhancing privacy. Our experimental results confirm that these approaches achieve superior privacy protection and retain high utility, making them viable for practical applications where both aspects are crucial. The research contributes to the field by providing a flexible and effective strategy for deploying privacy-preserving algorithms across various data types and establishing new benchmarks for utility and confidentiality in data analytics.
Abstract（参考訳）: 本研究では、プライバシ保護データ分析のための新しいフレームワークを開発し、データユーティリティとプライバシに関するバランスをとるという重要な課題に対処する。本稿では,高次元画像データに適したノイズ注入技術,高感度属性をマスキングしながら特徴抽出を行う可変オートエンコーダ(VAE),構造化データプライバシに最適化された期待最大化(EM)アプローチの3つの高度なアルゴリズムを紹介する。修正MNISTやCelebrityAなどのデータセットに適用することにより、機密属性と変換データ間の相互情報を著しく低減し、プライバシーを向上する。実験の結果,これらの手法が優れたプライバシ保護を実現し,高いユーティリティを保ち,両面が不可欠である実用的なアプリケーションに有効であることが確認された。この研究は、さまざまなデータタイプにまたがってプライバシ保護アルゴリズムをデプロイするためのフレキシブルで効果的な戦略を提供し、データ分析における実用性と機密性のための新しいベンチマークを確立することで、この分野に貢献する。

関連論文リスト

Privacy-Utility Trade-off in Data Publication: A Bilevel Optimization Framework with Curvature-Guided Perturbation [22.727580097886747]
プライベートデータセットを公開するための新しい双方向最適化フレームワークを導入する。上位レベルのタスクでは、識別器が生成プロセスをガイドし、潜伏変数が高品質なサンプルにマップされることを保証する。低レベルタスクでは、MIAに対する個々の脆弱性の定量的尺度として、データ多様体上の局所的外部曲率を用いる。
論文参考訳（メタデータ） (2025-09-02T07:44:21Z)
Improving Noise Efficiency in Privacy-preserving Dataset Distillation [59.57846442477106]
本稿では,最適化からサンプリングを分離してコンバージェンスを向上し,信号品質を向上させる新しいフレームワークを提案する。 CIFAR-10では,従来の最先端手法の蒸留セットサイズを5分の1に減らして,クラス毎50イメージでtextbf10.0%,クラス毎50イメージで textbf8.3%向上した。
論文参考訳（メタデータ） (2025-08-03T13:15:52Z)
Optimal Allocation of Privacy Budget on Hierarchical Data Release [48.96399034594329]
本稿では,階層データリリースにおける最適プライバシ予算割り当ての問題に対処する。データの粒度とプライバシー損失のトレードオフを考慮しつつ、全プライバシー予算の対象となるデータユーティリティの最大化を目指している。
論文参考訳（メタデータ） (2025-05-16T05:25:11Z)
Optimizing the Privacy-Utility Balance using Synthetic Data and Configurable Perturbation Pipelines [0.0]
本稿では,セキュリティの向上,分析ユーティリティの維持,大規模データセット管理における運用効率の向上のために,現代合成データ生成と高度データ摂動技術の戦略的利用について検討する。目標は、BFSI、ヘルスケア、リテール、通信といったデータに敏感な業界において重要なニーズである、複雑な機械学習タスクや分析に高いユーティリティを保持する、現実的なプライバシ保護データセットを作ることだ。
論文参考訳（メタデータ） (2025-04-24T15:52:53Z)
Adaptive Clipping for Privacy-Preserving Few-Shot Learning: Enhancing Generalization with Limited Data [12.614480013684759]
そこで我々は,メタクリップ(Meta-Clip)と呼ばれる新しい手法を導入する。トレーニング中にクリッピング閾値を動的に調整することにより、アダプティブクリッピング法は機密情報の開示をきめ細かな制御を可能にする。我々は,既存プライバシ保存技術に比べて優れたトレードオフを示すとともに,実用上の劣化を最小限に抑えるアプローチの有効性を実証する。
論文参考訳（メタデータ） (2025-03-27T05:14:18Z)
Multi-Objective Optimization-Based Anonymization of Structured Data for Machine Learning [0.5452584641316627]
本研究は,プライバシ保護のための既存最適化モデルにおける重要な制約を明らかにする。本稿では,情報損失を同時に最小化し,攻撃に対する防御を最大化する新しい多目的最適化モデルを提案する。
論文参考訳（メタデータ） (2025-01-02T01:52:36Z)
SafeSynthDP: Leveraging Large Language Models for Privacy-Preserving Synthetic Data Generation Using Differential Privacy [0.0]
差分プライバシー(DP)機構を用いた合成データセットを生成するための大規模言語モデル(Ms)の能力について検討する。提案手法では,ラプラス分布やガウス分布を含むDPベースのノイズ注入法をデータ生成プロセスに組み込む。次に、これらのDP強化合成データセットの有用性を、トレーニングされたMLモデルの性能と、元のデータでトレーニングされたモデルとを比較して評価する。
論文参考訳（メタデータ） (2024-12-30T01:10:10Z)
Differentially Private Federated Learning of Diffusion Models for Synthetic Tabular Data Generation [5.182014186927255]
DP-Fed-FinDiffフレームワークは、微分プライバシー、フェデレーションラーニング、拡散確率モデルの新たな統合である。複数の実世界の財務データセットに対するDP-Fed-FinDiffの有効性を示す。その結果、DP-Fed-FinDiffが、高度に規制されたドメインでセキュアなデータ共有とロバストな分析を可能にする可能性を確認した。
論文参考訳（メタデータ） (2024-12-20T17:30:58Z)
DP-CDA: An Algorithm for Enhanced Privacy Preservation in Dataset Synthesis Through Randomized Mixing [0.8739101659113155]
有効なデータパブリッシングアルゴリズムであるemphDP-CDAを導入する。提案アルゴリズムは、クラス固有の方法でデータをランダムに混合し、プライバシー保証を確保するために慎重に調整されたランダム性を誘導することにより、合成データセットを生成する。以上の結果から,DP-CDAを用いた合成データセットは,同一のプライバシー要件下であっても,従来のデータパブリッシングアルゴリズムで生成したデータセットよりも優れた実用性が得られることが示唆された。
論文参考訳（メタデータ） (2024-11-25T06:14:06Z)
Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。 RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文参考訳（メタデータ） (2024-06-20T22:53:09Z)
FewFedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning [54.26614091429253]
フェデレーション・インストラクション・チューニング(FedIT)は、複数のデータ所有者間で協調的なトレーニングを統合することで、有望なソリューションである。 FedITは、インストラクショナルデータの不足や、トレーニングデータ抽出攻撃への露出リスクなどの制限に直面している。本稿では,FewFedPITを提案する。このFewFedPITは,フェデレートされた数ショット学習のプライバシー保護とモデル性能を同時に向上する。
論文参考訳（メタデータ） (2024-03-10T08:41:22Z)
Data Collaboration Analysis Over Matrix Manifolds [0.0]
プライバシー保護機械学習(PPML)は、機密情報の保護によってこの問題に対処する。 NRI-DCフレームワークは革新的なアプローチとして登場し、機関間の「データアイランド」問題を解消する可能性がある。本研究は,これらの協調関数の厳密な理論的基礎を確立し,新しい定式化を導入する。
論文参考訳（メタデータ） (2024-03-05T08:52:16Z)
A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文参考訳（メタデータ） (2023-09-27T14:38:16Z)
Approximate, Adapt, Anonymize (3A): a Framework for Privacy Preserving Training Data Release for Machine Learning [3.29354893777827]
データリリースフレームワークである3A(Approximate, Adapt, Anonymize)を導入し、機械学習のデータユーティリティを最大化する。本稿では,実データセットと民生データセットでトレーニングしたモデルの性能指標の相違が最小限に抑えられることを示す実験的な証拠を示す。
論文参考訳（メタデータ） (2023-07-04T18:37:11Z)
Theoretically Principled Federated Learning for Balancing Privacy and Utility [61.03993520243198]
モデルパラメータを歪ませることでプライバシを保護する保護機構の一般学習フレームワークを提案する。フェデレートされた学習における各コミュニケーションラウンドにおいて、各クライアント上の各モデルパラメータに対して、パーソナライズされたユーティリティプライバシトレードオフを実現することができる。
論文参考訳（メタデータ） (2023-05-24T13:44:02Z)
Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (2022-11-07T10:02:55Z)
Decentralized Stochastic Optimization with Inherent Privacy Protection [103.62463469366557]
分散最適化は、現代の協調機械学習、分散推定と制御、大規模センシングの基本的な構成要素である。データが関与して以降、分散最適化アルゴリズムの実装において、プライバシ保護がますます重要になっている。
論文参考訳（メタデータ） (2022-05-08T14:38:23Z)
Efficient Logistic Regression with Local Differential Privacy [0.0]
モノのインターネット(Internet of Things)デバイスは急速に拡大し、大量のデータを生み出している。これらのデバイスから収集されたデータを探索する必要性が高まっている。コラボレーション学習は、モノのインターネット(Internet of Things)設定に戦略的ソリューションを提供すると同時に、データのプライバシに関する一般の懸念も引き起こす。
論文参考訳（メタデータ） (2022-02-05T22:44:03Z)
P3GM: Private High-Dimensional Data Release via Privacy Preserving Phased Generative Model [23.91327154831855]
本稿では,プライバシ保護型位相生成モデル(P3GM)を提案する。 P3GMは2段階の学習プロセスを採用し、ノイズに対して堅牢にし、学習効率を向上させる。最先端の手法と比較して、生成したサンプルはノイズが少なく、データ多様性の観点からも元のデータに近いように見える。
論文参考訳（メタデータ） (2020-06-22T09:47:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。