論文の概要: Privacy-Preserving and Lossless Distributed Estimation of
High-Dimensional Generalized Additive Mixed Models
- arxiv url: http://arxiv.org/abs/2210.07723v1
- Date: Fri, 14 Oct 2022 11:41:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 15:58:00.700834
- Title: Privacy-Preserving and Lossless Distributed Estimation of
High-Dimensional Generalized Additive Mixed Models
- Title(参考訳): 高次元一般化付加混合モデルのプライバシ保存とロスレス分散推定
- Authors: Daniel Schalk, Bernd Bischl, David R\"ugamer
- Abstract要約: CWBを用いたGAMM(Generalized Additive Mixed Model)の分散・プライバシ保存・ロスレス推定アルゴリズムを提案する。
我々のCWBの適応は、偏りのない特徴選択や高次元特徴空間におけるモデル適合性など、元のアルゴリズムのすべての重要な特性を保っている。
また, 分散心疾患データセット上でのアルゴリズムの有効性を実証し, 最先端の手法と比較した。
- 参考スコア(独自算出の注目度): 0.9023847175654603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Various privacy-preserving frameworks that respect the individual's privacy
in the analysis of data have been developed in recent years. However, available
model classes such as simple statistics or generalized linear models lack the
flexibility required for a good approximation of the underlying data-generating
process in practice. In this paper, we propose an algorithm for a distributed,
privacy-preserving, and lossless estimation of generalized additive mixed
models (GAMM) using component-wise gradient boosting (CWB). Making use of CWB
allows us to reframe the GAMM estimation as a distributed fitting of base
learners using the $L_2$-loss. In order to account for the heterogeneity of
different data location sites, we propose a distributed version of a row-wise
tensor product that allows the computation of site-specific (smooth) effects.
Our adaption of CWB preserves all the important properties of the original
algorithm, such as an unbiased feature selection and the feasibility to fit
models in high-dimensional feature spaces, and yields equivalent model
estimates as CWB on pooled data. Next to a derivation of the equivalence of
both algorithms, we also showcase the efficacy of our algorithm on a
distributed heart disease data set and compare it with state-of-the-art
methods.
- Abstract(参考訳): 近年、データの分析において個人のプライバシーを尊重する様々なプライバシー保護フレームワークが開発されている。
しかし、単純な統計や一般化線形モデルのような利用可能なモデルクラスは、実際のデータ生成プロセスの適切な近似に必要な柔軟性を欠いている。
本稿では, GAMM (Generalized Additive Mixed Model) の分散, プライバシ保護, ロスレス推定のための, コンポーネントワイド・グラデーション・ブーイング (CWB) を用いたアルゴリズムを提案する。
CWBを利用すると、$L_2$-lossを使ってベース学習者の分散フィッティングとしてGAMM推定を再構成できる。
異なるデータロケーションサイトの不均一性を考慮するために,サイト固有(スムース)効果の計算を可能にする行方向テンソル積の分散バージョンを提案する。
我々のCWBの適応性は、偏りのない特徴選択や高次元の特徴空間におけるモデル適合性など、元のアルゴリズムのすべての重要な特性を保存し、プールデータ上でCWBとして等価なモデル推定値を得る。
両アルゴリズムの等価性の導出に続いて, 分散心疾患データセット上でのアルゴリズムの有効性を実証し, 最先端の手法と比較した。
関連論文リスト
- Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - Bayesian Estimation and Tuning-Free Rank Detection for Probability Mass Function Tensors [17.640500920466984]
本稿では,関節のPMFを推定し,そのランクを観測データから自動的に推定する新しい枠組みを提案する。
我々は、様々なモデルパラメータの後方分布を近似するために、変分推論(VI)に基づく決定論的解を導出し、さらに、変分推論(SVI)を利用して、VVIベースのアプローチのスケーラブルバージョンを開発する。
合成データと実映画レコメンデーションデータの両方を含む実験は、推定精度、自動ランク検出、計算効率の点で、VVIおよびSVIベースの手法の利点を示している。
論文 参考訳(メタデータ) (2024-10-08T20:07:49Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - An Empirical Analysis of Fairness Notions under Differential Privacy [3.3748750222488657]
DP-SGDに適したモデルアーキテクチャを選択すると、統計的公正基準の異なるクラスに属する異なる公正概念がどう影響するかを示す。
これらの発見は、偏りのあるデータセットに基づいてトレーニングされたディープラーニングモデルにおいて、差分プライバシーが必ずしも不公平を悪化させるという理解に挑戦する。
論文 参考訳(メタデータ) (2023-02-06T16:29:50Z) - Validation Diagnostics for SBI algorithms based on Normalizing Flows [55.41644538483948]
本研究は,NFに基づく多次元条件(後)密度推定器の検証診断を容易にすることを提案する。
また、局所的な一貫性の結果に基づいた理論的保証も提供する。
この作業は、より良い特定モデルの設計を支援したり、新しいSBIアルゴリズムの開発を促進するのに役立つだろう。
論文 参考訳(メタデータ) (2022-11-17T15:48:06Z) - The effectiveness of factorization and similarity blending [0.0]
CF(Collaborative Filtering)は、過去のユーザの好みデータを活用して行動パターンを特定し、カスタムレコメンデーションを予測するテクニックである。
因子分解と類似性に基づくアプローチを組み合わせることで,スタンドアローンモデルにおける誤差の顕著な減少(-9.4%)が期待できることを示す。
本稿では,従来のアルゴリズムの複雑さを一貫して低減する類似性モデルSCSRの新たな拡張を提案する。
論文 参考訳(メタデータ) (2022-09-16T13:11:27Z) - Spike-and-Slab Generalized Additive Models and Scalable Algorithms for
High-Dimensional Data [0.0]
本稿では,高次元データに対応するため,階層型一般化加法モデル(GAM)を提案する。
曲線の適切な縮退と滑らか化関数線型空間と非線形空間の分離に対する平滑化ペナルティを考察する。
2つの決定論的アルゴリズム、EM-Coordinate Descent と EM-Iterative Weighted Least Squares は異なるユーティリティ向けに開発された。
論文 参考訳(メタデータ) (2021-10-27T14:11:13Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。
提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文 参考訳(メタデータ) (2020-06-24T17:53:53Z) - Differentially Private Federated Learning with Laplacian Smoothing [72.85272874099644]
フェデレートラーニングは、ユーザ間でプライベートデータを共有せずに、協調的にモデルを学習することで、データのプライバシを保護することを目的としている。
敵は、リリースしたモデルを攻撃することによって、プライベートトレーニングデータを推測することができる。
差別化プライバシは、トレーニングされたモデルの正確性や実用性を著しく低下させる価格で、このような攻撃に対する統計的保護を提供する。
論文 参考訳(メタデータ) (2020-05-01T04:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。