Fugu-MT 論文翻訳(概要): On Reconstructing Training Data From Bayesian Posteriors and Trained Models

論文の概要: On Reconstructing Training Data From Bayesian Posteriors and Trained Models

arxiv url: http://arxiv.org/abs/2507.18372v1
Date: Thu, 24 Jul 2025 12:49:41 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-25 15:10:43.712557
Title: On Reconstructing Training Data From Bayesian Posteriors and Trained Models
Title（参考訳）: ベイジアン後部および訓練モデルからのトレーニングデータ再構成について
Authors: George Wynne,
Abstract要約: トレーニングされたパラメータでモデルの仕様を公開することにより、相手はトレーニングデータに関する情報を再構築することが可能になる。本稿では,問題を表現するための数学的枠組みを確立すること,最大平均差分同値によって脆弱なトレーニングデータの特徴を特徴づけること,ベイジアンモデルと非ベイジアンモデルの両方でデータを再構成するためのスコアマッチングフレームワークを概説すること,の3つの主要な貢献を行う。
参考スコア（独自算出の注目度）: 4.061135251278187
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Publicly releasing the specification of a model with its trained parameters means an adversary can attempt to reconstruct information about the training data via training data reconstruction attacks, a major vulnerability of modern machine learning methods. This paper makes three primary contributions: establishing a mathematical framework to express the problem, characterising the features of the training data that are vulnerable via a maximum mean discrepancy equivalance and outlining a score matching framework for reconstructing data in both Bayesian and non-Bayesian models, the former is a first in the literature.
Abstract（参考訳）: トレーニングされたパラメータでモデルの仕様を公開することで、敵はトレーニングデータ再構成攻撃を通じてトレーニングデータに関する情報を再構築しようとすることができる。本稿では,この問題を表現するための数学的枠組みを確立すること,最大平均差分法により脆弱なトレーニングデータの特徴を特徴付けること,ベイズモデルと非ベイズモデルの両方でデータを再構成するためのスコアマッチングフレームワークを概説すること,という3つの主要な貢献を行う。

関連論文リスト

Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文参考訳（メタデータ） (2024-10-22T06:43:28Z)
Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文参考訳（メタデータ） (2024-06-16T17:09:24Z)
Distilled Datamodel with Reverse Gradient Matching [74.75248610868685]
オフライントレーニングとオンライン評価段階を含む,データ影響評価のための効率的なフレームワークを提案する。提案手法は, 直接再学習法と比較して, プロセスの大幅な高速化を図りながら, 同等のモデル行動評価を実現する。
論文参考訳（メタデータ） (2024-04-22T09:16:14Z)
Fantastic Gains and Where to Find Them: On the Existence and Prospect of General Knowledge Transfer between Any Pretrained Model [74.62272538148245]
事前訓練されたモデルの任意のペアリングに対して、一方のモデルは他方では利用できない重要なデータコンテキストを抽出する。このような「補的」な知識を,性能劣化を伴わずに,あるモデルから別のモデルへ伝達できるかどうかを検討する。
論文参考訳（メタデータ） (2023-10-26T17:59:46Z)
Machine Unlearning Methodology base on Stochastic Teacher Network [33.763901254862766]
「忘れられる権利」は、データ所有者に、モデルトレーニングに使用したデータを積極的に取り出す権利を与える。既存の機械学習手法は、ディープラーニングモデルから知識を素早く取り除くのに効果がないことが判明した。本稿では,ネットワークを教師として利用して,忘れられたデータによる影響の軽減を図ることを提案する。
論文参考訳（メタデータ） (2023-08-28T06:05:23Z)
Alleviating the Effect of Data Imbalance on Adversarial Training [26.36714114672729]
長い尾の分布に従うデータセットの逆トレーニングについて検討する。我々は、新しい対人訓練フレームワーク、Re-balancing Adversarial Training (REAT)を提案する。
論文参考訳（メタデータ） (2023-07-14T07:01:48Z)
Boosting Model Inversion Attacks with Adversarial Examples [26.904051413441316]
ブラックボックス設定において、より高い攻撃精度を達成できる学習ベースモデル反転攻撃のための新しい訓練パラダイムを提案する。まず,攻撃モデルの学習過程を,意味的損失関数を追加して規則化する。第2に、学習データに逆例を注入し、クラス関連部の多様性を高める。
論文参考訳（メタデータ） (2023-06-24T13:40:58Z)
Reconstructing Training Data from Model Gradient, Provably [68.21082086264555]
ランダムに選択されたパラメータ値で1つの勾配クエリからトレーニングサンプルを再構成する。センシティブなトレーニングデータを示す証明可能な攻撃として、われわれの発見はプライバシーに対する深刻な脅威を示唆している。
論文参考訳（メタデータ） (2022-12-07T15:32:22Z)
Reconstructing Training Data with Informed Adversaries [30.138217209991826]
機械学習モデルへのアクセスを考えると、敵はモデルのトレーニングデータを再構築できるだろうか? 本研究は、この疑問を、学習データポイントの全てを知っている強力な情報提供者のレンズから研究する。この厳密な脅威モデルにおいて、残りのデータポイントを再構築することは可能であることを示す。
論文参考訳（メタデータ） (2022-01-13T09:19:25Z)
Reconstructing Training Data from Diverse ML Models by Ensemble Inversion [8.414622657659168]
モデルインバージョン(MI)は、学習された機械学習(ML)モデルへのアクセスを敵が悪用するものであり、研究の注目を集めている。本研究では,訓練されたモデルのアンサンブルに制約されたジェネレータを訓練することにより,元のトレーニングデータの分布を推定するアンサンブル変換手法を提案する。データセットを使わずに高品質な結果が得られ、想定されるトレーニングデータに類似した補助データセットを利用することで、結果がどう改善されるかを示す。
論文参考訳（メタデータ） (2021-11-05T18:59:01Z)
Delving into Data: Effectively Substitute Training for Black-box Attack [84.85798059317963]
本稿では,知識盗むプロセスで使用されるデータの分散設計に焦点をあてた,新しい視点代替トレーニングを提案する。これら2つのモジュールの組み合わせにより、代替モデルとターゲットモデルの一貫性がさらに向上し、敵攻撃の有効性が大幅に向上する。
論文参考訳（メタデータ） (2021-04-26T07:26:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。