論文の概要: On the Consistency and Performance of the Iterative Bayesian Update
- arxiv url: http://arxiv.org/abs/2508.09980v1
- Date: Wed, 13 Aug 2025 17:52:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.986881
- Title: On the Consistency and Performance of the Iterative Bayesian Update
- Title(参考訳): 反復ベイズ更新の一貫性と性能について
- Authors: Ehab ElSalamouny, Catuscia Palamidessi,
- Abstract要約: ノイズデータの増加に伴うIBUの推定値の実際の分布に対する整合性は,本論文では無視あるいは誤って証明されている。
IBUは、幾何学的、ラプラス的、指数的メカニズムによってユーザのデータを衛生化する際に、他の手法よりも著しく優れていることを示す。
また、センシティブなデータのアルファベットが無限である場合についても検討し、この場合もIBUが動作する技術を示す。
- 参考スコア(独自算出の注目度): 6.8983321521373195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For many social, scientific, and commercial purposes, it is often important to estimate the distribution of the users' data regarding a sensitive attribute, e.g., their ages, locations, etc. To allow this estimation while protecting the users' privacy, every user applies a local privacy protection mechanism that releases a noisy (sanitized) version of their original datum to the data collector; then the original distribution is estimated using one of the known methods, such as the matrix inversion (INV), RAPPOR's estimator, and the iterative Bayesian update (IBU). Unlike the other estimators, the consistency of IBU, i.e., the convergence of its estimate to the real distribution as the amount of noisy data grows, has been either ignored or incorrectly proved in the literature. In this article, we use the fact that IBU is a maximum likelihood estimator to prove that IBU is consistent. We also show, through experiments on real datasets, that IBU significantly outperforms the other methods when the users' data are sanitized by geometric, Laplace, and exponential mechanisms, whereas it is comparable to the other methods in the case of the k-RR and RAPPOR mechanisms. Finally, we consider the case when the alphabet of the sensitive data is infinite, and we show a technique that allows IBU to operate in this case too.
- Abstract(参考訳): 多くの社会的、科学的、商業的な目的のために、敏感な属性、例えば年齢、場所などに関するユーザのデータの分布を推定することが重要である。
ユーザのプライバシを保護しながらこの推定を可能にするため、各ユーザは、元のダタムのノイズ(消毒)バージョンをデータコレクタにリリースするローカルプライバシ保護機構を適用し、元のディストリビューションは、行列反転(INV)、RAPPORの推定器、反復ベイズ更新(IBU)などの既知の方法の1つを使用して推定される。
他の推定値とは異なり、IBUの一貫性、すなわち、ノイズデータの量が増えるにつれて実際の分布への推定値の収束は無視されているか、あるいは誤って証明されている。
本稿では、IBUが最大極大推定器であるという事実を用いて、IBUが一貫したものであることを証明する。
また, 実データを用いた実験により, ユーザのデータを幾何学的, ラプラス的, 指数的機構でサニタイズした場合, IBUが他の手法よりも優れており, k-RR と RAPPOR の機構では他の手法に匹敵することを示す。
最後に、センシティブなデータのアルファベットが無限である場合について考察し、この場合のIBUの動作を可能にする手法を示す。
関連論文リスト
- Benchmarking Fraud Detectors on Private Graph Data [70.4654745317714]
現在、多くの種類の不正は、グラフ上で動く自動検出アルゴリズムによって部分的に管理されている。
データ保有者が不正検知器の開発を第三者にアウトソースしようとするシナリオを考察する。
サードパーティは、不正検出をデータ保持者に送信し、これらのアルゴリズムをプライベートデータセットで評価し、その結果を公表する。
本システムに対する現実的なプライバシ攻撃を提案し,評価結果のみに基づいて個人データの匿名化を可能にする。
論文 参考訳(メタデータ) (2025-07-30T03:20:15Z) - Is merging worth it? Securely evaluating the information gain for causal dataset acquisition [9.373086204998348]
我々は、マージの価値を定量化するための、最初の暗号的にセキュアな情報理論アプローチを導入する。
我々は、多要素計算を用いて予測情報ゲイン(EIG)を評価し、生データが明らかにされないようにする。
さらに、我々のアプローチは、任意のプライバシー要件を満たすために、差分プライバシー(DP)と組み合わせることができることを実証する。
論文 参考訳(メタデータ) (2024-09-11T12:17:01Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - On the Utility Gain of Iterative Bayesian Update for Locally
Differentially Private Mechanisms [4.525735598810446]
局所微分プライベート (LDP) 機構で隠蔽されたデータを用いて, プライベートな離散分布推定にイテレーティブベイズ更新 (IBU) を用いる。
IBU と Matrix Inversion (MI) の性能を比較し,複数のデータ収集のために設計された 7 つの LDP 機構と 7 つの LDP 機構を比較した。
以上の結果から,IBUは,追加のプライバシコストを伴わずに,異なるシナリオにおけるLPPメカニズムの有用性を向上させる上で有用な後処理ツールである可能性が示唆された。
論文 参考訳(メタデータ) (2023-07-15T08:40:39Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Exploring validation metrics for offline model-based optimisation with
diffusion models [50.404829846182764]
モデルベース最適化(MBO)では、マシンラーニングを使用して、(基底真理)オラクルと呼ばれるブラックボックス関数に対する報酬の尺度を最大化する候補を設計することに興味があります。
モデル検証中に基底オラクルに対する近似をトレーニングし、その代わりに使用することができるが、その評価は近似的であり、敵の例に対して脆弱である。
本手法は,外挿量を測定するために提案した評価フレームワークにカプセル化されている。
論文 参考訳(メタデータ) (2022-11-19T16:57:37Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。