論文の概要: Towards Reliable and Generalizable Differentially Private Machine Learning (Extended Version)
- arxiv url: http://arxiv.org/abs/2508.15141v1
- Date: Thu, 21 Aug 2025 00:27:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.134905
- Title: Towards Reliable and Generalizable Differentially Private Machine Learning (Extended Version)
- Title(参考訳): 信頼性と一般化可能な微分プライベート機械学習(拡張版)を目指して
- Authors: Wenxuan Bao, Vincent Bindschaedler,
- Abstract要約: 近年,新しい分別プライベート機械学習(DPML)技術を提案する研究が盛んに行われている。
これらの論文は、新しい最先端(SoTA)の結果を達成し、実証的な結果を検証として提供すると主張している。
どのテクニックが最も効果的か、それとも本当に彼らの主張を満足しているかについては合意がない。
- 参考スコア(独自算出の注目度): 7.223425966203561
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is a flurry of recent research papers proposing novel differentially private machine learning (DPML) techniques. These papers claim to achieve new state-of-the-art (SoTA) results and offer empirical results as validation. However, there is no consensus on which techniques are most effective or if they genuinely meet their stated claims. Complicating matters, heterogeneity in codebases, datasets, methodologies, and model architectures make direct comparisons of different approaches challenging. In this paper, we conduct a reproducibility and replicability (R+R) experiment on 11 different SoTA DPML techniques from the recent research literature. Results of our investigation are varied: while some methods stand up to scrutiny, others falter when tested outside their initial experimental conditions. We also discuss challenges unique to the reproducibility of DPML, including additional randomness due to DP noise, and how to address them. Finally, we derive insights and best practices to obtain scientifically valid and reliable results.
- Abstract(参考訳): 近年,新しい分別プライベート機械学習(DPML)技術を提案する研究が盛んに行われている。
これらの論文は、新しい最先端(SoTA)の結果を達成し、実証的な結果を検証として提供すると主張している。
しかし、どのテクニックが最も効果的か、それとも本当に彼らの主張に合致しているかについては合意が得られていない。
コードベース、データセット、方法論、モデルアーキテクチャの複雑化、不均一性は、異なるアプローチの直接的な比較を困難にします。
本稿では,11種類の SoTA DPML 技術を用いた再現性と複製性(R+R)実験を行った。
調査の結果は様々であり、いくつかの手法は精査に立脚するが、他の手法は初期の実験条件の外での試験で失敗する。
また,DPMLの再現性に特有の課題についても論じる。
最後に、科学的に妥当で信頼性の高い結果を得るために、洞察とベストプラクティスを導き出す。
関連論文リスト
- Continual Multimodal Contrastive Learning [70.60542106731813]
マルチモーダル・コントラッシブ・ラーニング(MCL)は、異なるモーダルを整列させ、関節空間で多モーダル表現を生成する。
マルチモーダルデータは単一のプロセスで収集されることはめったになく、スクラッチからのトレーニングは計算コストがかかる。
本稿では, 安定性と塑性の2つの原理によりCMCLを定式化する。
理論的には、二辺から部分空間への勾配の更新を計画する、新しい最適化に基づく手法を導出する。
論文 参考訳(メタデータ) (2025-03-19T07:57:08Z) - Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
予測型因果推論(PPCI)に焦点をあてる
PPCIは、未ラベルの事実結果を用いた対象実験における治療効果を推定し、事前訓練されたモデルからゼロショットを取得する。
バニラ実験的リスク最小化によって解決不可能なインスタンスに対するソリューションを提供するため,本手法を合成および実世界の科学的データに対して検証する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - A Debate-Driven Experiment on LLM Hallucinations and Accuracy [7.821303946741665]
本研究では,大規模言語モデル(LLM)における幻覚現象について検討する。
GPT-4o-Miniモデルの複数のインスタンスは、TrathfulQAデータセットからの質問によって引き起こされた議論のような相互作用に関与している。
1つのモデルは、もっともらしいが偽の答えを生成するように故意に指示され、他のモデルは真に応答するように要求される。
論文 参考訳(メタデータ) (2024-10-25T11:41:27Z) - SoK: Privacy-Preserving Data Synthesis [72.92263073534899]
本稿では,プライバシ保護データ合成(PPDS)に注目し,その分野の総合的な概要,分析,議論を行う。
PPDSでは,統計的手法と深層学習(DL)に基づく手法の2つの顕著な研究を統一するマスターレシピを作成した。
論文 参考訳(メタデータ) (2023-07-05T08:29:31Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - A quantitative study of NLP approaches to question difficulty estimation [0.30458514384586394]
この研究は、以前の研究で提案されたいくつかのアプローチを定量的に分析し、異なる教育領域のデータセットのパフォーマンスを比較した。
私たちは、Transformerベースのモデルが様々な教育領域で最高のパフォーマンスを示しており、DistilBERTはBERTとほぼ同等に機能していることに気付きました。
他のモデルでは、ハイブリットは単一のタイプの特徴に基づくものよりも優れており、言語的特徴に基づくものは理解された質問を読み取るのに優れ、周波数ベースの特徴(TF-IDF)と単語埋め込み(word2vec)はドメイン知識の評価において優れている。
論文 参考訳(メタデータ) (2023-05-17T14:26:00Z) - A Fair Experimental Comparison of Neural Network Architectures for
Latent Representations of Multi-Omics for Drug Response Prediction [7.690774882108066]
等価条件下でのマルチオミクス統合手法の訓練と最適化を行う。
我々は、中間統合と後期統合の利点を組み合わせた新しい手法、Omics Stackingを考案した。
複数のオミクスデータを用いた公開薬物応答データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2022-08-31T12:46:08Z) - A Multiple kernel testing procedure for non-proportional hazards in
factorial designs [4.358626952482687]
本稿では,複数の因子が同時に興味を持つ場合の生存率を推定するマルチカーネルテスト手法を提案する。
我々の手法は複雑なデータを扱うことができ、比例性のような仮定を正当化できない場合、全正規の Cox モデルに代わるものとして見ることができる。
論文 参考訳(メタデータ) (2022-06-15T01:53:49Z) - A reproducible experimental survey on biomedical sentence similarity: a
string-based method sets the state of the art [0.0]
本報告では,生物医学的文章類似性に関する再現可能な実験結果として,最大かつ初めて紹介する。
本研究の目的は,問題の現状を解明し,現状の手法の評価を未然に防ぐことにある。
実験の結果,前処理段階と NER ツールの選択が文類似性手法の性能に大きく影響していることが確認された。
論文 参考訳(メタデータ) (2022-05-18T06:20:42Z) - An Investigation of Replay-based Approaches for Continual Learning [79.0660895390689]
連続学習(CL)は機械学習(ML)の大きな課題であり、破滅的忘れ(CF)を伴わずに連続的に複数のタスクを学習する能力を記述する。
いくつかの解クラスが提案されており、その単純さと堅牢性から、いわゆるリプレイベースのアプローチは非常に有望であるように思われる。
連続学習におけるリプレイに基づくアプローチを実証的に検討し,応用の可能性を評価する。
論文 参考訳(メタデータ) (2021-08-15T15:05:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。