論文の概要: Machine Unlearning for Causal Inference
- arxiv url: http://arxiv.org/abs/2308.13559v1
- Date: Thu, 24 Aug 2023 17:27:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 20:38:26.047361
- Title: Machine Unlearning for Causal Inference
- Title(参考訳): 因果推論のための機械学習
- Authors: Vikas Ramachandra and Mohit Sethi
- Abstract要約: モデルが与えられたユーザに関する情報(マシンアンラーニング)の学習/取得の一部を忘れることが重要である。
本稿では、因果推論のための機械学習の概念、特に確率スコアマッチングと治療効果推定について紹介する。
この研究で使用されるデータセットは、ジョブトレーニングプログラムの有効性を評価するために広く使用されているデータセットであるLalondeデータセットである。
- 参考スコア(独自算出の注目度): 0.6621714555125157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models play a vital role in making predictions and deriving
insights from data and are being increasingly used for causal inference. To
preserve user privacy, it is important to enable the model to forget some of
its learning/captured information about a given user (machine unlearning). This
paper introduces the concept of machine unlearning for causal inference,
particularly propensity score matching and treatment effect estimation, which
aims to refine and improve the performance of machine learning models for
causal analysis given the above unlearning requirements. The paper presents a
methodology for machine unlearning using a neural network-based propensity
score model. The dataset used in the study is the Lalonde dataset, a widely
used dataset for evaluating the effectiveness i.e. the treatment effect of job
training programs. The methodology involves training an initial propensity
score model on the original dataset and then creating forget sets by
selectively removing instances, as well as matched instance pairs. based on
propensity score matching. These forget sets are used to evaluate the retrained
model, allowing for the elimination of unwanted associations. The actual
retraining of the model is performed using the retain set. The experimental
results demonstrate the effectiveness of the machine unlearning approach. The
distribution and histogram analysis of propensity scores before and after
unlearning provide insights into the impact of the unlearning process on the
data. This study represents the first attempt to apply machine unlearning
techniques to causal inference.
- Abstract(参考訳): 機械学習モデルは、予測やデータからの洞察の導出に重要な役割を果たし、因果推論にますます使われている。
ユーザのプライバシを維持するためには、モデルが与えられたユーザ(マシンアンラーニング)に関する学習/キャプチャ情報の一部を忘れることが重要である。
本稿では, 因果推論のための機械学習の概念, 特に確率スコアマッチングと治療効果推定について紹介し, 上記の未学習要件に基づき, 因果解析のための機械学習モデルの性能を洗練・改善することを目的とする。
本稿では,ニューラルネットワークを用いた確率スコアモデルを用いた機械学習手法を提案する。
この研究で使用されるデータセットはLalondeデータセットであり、ジョブトレーニングプログラムの処理効果を評価するために広く使われているデータセットである。
この方法論では、最初のproensityスコアモデルを元のデータセットでトレーニングし、インスタンスを選択的に削除して、マッチしたインスタンスペアを生成する。
傾向スコアマッチングに基づく。
これらの誤り集合は再訓練されたモデルを評価するために使用され、不要な関連を排除できる。
保持セットを用いてモデルの実際の再訓練を行う。
実験の結果,機械学習手法の有効性が示された。
アンラーニング前後の確率スコアの分布とヒストグラム解析は、アンラーニングプロセスがデータに与える影響についての洞察を提供する。
本研究は,因果推論にマシンアンラーニング手法を適用する最初の試みである。
関連論文リスト
- Machine Unlearning on Pre-trained Models by Residual Feature Alignment Using LoRA [15.542668474378633]
本稿では,事前学習モデルを用いた新しい機械学習手法を提案する。
LoRAを利用して、モデルの中間機能を事前訓練された特徴と残像に分解する。
本手法は,保持集合上のゼロ残差を学習し,未学習集合上でシフト残差を学習することを目的としている。
論文 参考訳(メタデータ) (2024-11-13T08:56:35Z) - Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - Distilled Datamodel with Reverse Gradient Matching [74.75248610868685]
オフライントレーニングとオンライン評価段階を含む,データ影響評価のための効率的なフレームワークを提案する。
提案手法は, 直接再学習法と比較して, プロセスの大幅な高速化を図りながら, 同等のモデル行動評価を実現する。
論文 参考訳(メタデータ) (2024-04-22T09:16:14Z) - Task-Aware Machine Unlearning and Its Application in Load Forecasting [4.00606516946677]
本稿では、すでに訓練済みの予測器に対するデータセットの一部の影響を除去するために特別に設計された機械学習の概念を紹介する。
局所モデルパラメータ変化の感度を影響関数とサンプル再重み付けを用いて評価することにより,性能認識アルゴリズムを提案する。
リアルな負荷データセットを用いて,線形,CNN,Mixerベースの負荷予測器上で,未学習アルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-08-28T08:50:12Z) - Machine Unlearning Methodology base on Stochastic Teacher Network [33.763901254862766]
「忘れられる権利」は、データ所有者に、モデルトレーニングに使用したデータを積極的に取り出す権利を与える。
既存の機械学習手法は、ディープラーニングモデルから知識を素早く取り除くのに効果がないことが判明した。
本稿では,ネットワークを教師として利用して,忘れられたデータによる影響の軽減を図ることを提案する。
論文 参考訳(メタデータ) (2023-08-28T06:05:23Z) - Machine Unlearning Method Based On Projection Residual [23.24026891609028]
本稿ではニュートン法に基づく投射残差法を採用する。
主な目的は、線形回帰モデルとニューラルネットワークモデルという文脈で機械学習タスクを実装することである。
実験により, この手法は, モデル再学習に近いデータ削除において, より徹底的な手法であることが確認された。
論文 参考訳(メタデータ) (2022-09-30T07:29:55Z) - Machine Unlearning of Features and Labels [72.81914952849334]
機械学習モデルにおけるアンラーニングとラベルのファーストシナリオを提案する。
提案手法は,影響関数の概念に基づいて,モデルパラメータのクローズドフォーム更新によるアンラーニングを実現する。
論文 参考訳(メタデータ) (2021-08-26T04:42:24Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Learning to Reweight with Deep Interactions [104.68509759134878]
本稿では,教師モデルに内部状態を提供する改良型データ再重み付けアルゴリズムを提案する。
クリーン/ノイズラベルとニューラルマシン翻訳を用いた画像分類実験は、我々のアルゴリズムが従来の手法よりも大幅に改善されていることを実証的に実証した。
論文 参考訳(メタデータ) (2020-07-09T09:06:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。