論文の概要: Not Every Subject Should Stay: Machine Unlearning for Noisy Engagement Recognition
- arxiv url: http://arxiv.org/abs/2605.04713v1
- Date: Wed, 06 May 2026 10:03:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.763082
- Title: Not Every Subject Should Stay: Machine Unlearning for Noisy Engagement Recognition
- Title(参考訳): すべての被験者が待機すべきではない: ノイズの多いエンゲージメント認識のための機械学習
- Authors: Alexander Vedernikov,
- Abstract要約: エンゲージメント認識データセットは典型的には主観的インデクシングであり、しばしば騒々しく主観的な監督を含んでいる。
本研究では、この設定を、エンゲージメント認識のためのポストホック衛生機構として、主観レベルマシンアンラーニングを通して研究する。
- 参考スコア(独自算出の注目度): 53.005382593686356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Engagement recognition datasets are typically subject-indexed and often contain noisy, subjective supervision, making post-hoc dataset revision a practical problem. Existing noisy-label and data-cleaning methods largely operate at the sample level before or during training, but do not directly address a different question: once a model has already been trained, can the influence of an entire problematic subject be removed without full retraining? We study this setting through subject-level machine unlearning as a post-hoc sanitization mechanism for engagement recognition. Starting from a baseline trained on all subjects, we rank candidate harmful subjects using a model-dependent proxy, apply a lightweight approximate unlearning update, and compare the result against an oracle model retrained from scratch on the retained subjects only. We instantiate this protocol on DAiSEE and EngageNet using Tensor-Convolution and Convolution-Transformer Network (TCCT-Net) as a fixed platform and evaluate three matched model states under the same removal scenario: baseline, unlearned, and oracle. In representative K=3 forget-set settings, the unlearned model recovers 89.3% and 92.5% of the oracle gain on EngageNet and DAiSEE, respectively, at roughly one quarter of retraining cost. Across the tested small-audit regimes, effectiveness is strongest at an intermediate forget-set size, indicating that approximate subject-level unlearning is a useful low-cost correction mechanism, but one whose benefit depends on subject selection quality and removal regime.
- Abstract(参考訳): エンゲージメント認識データセットは、典型的には主観的インデックスであり、しばしばノイズ、主観的監視を含んでおり、ポストホックデータセットの改訂を実用的な問題にしている。
既存のノイズの多いラベルとデータクリーニングの方法は、トレーニング前やトレーニング中は、主にサンプルレベルで動作しますが、別の問題に対処することはできません。
本研究では、この設定を、エンゲージメント認識のためのポストホック衛生機構として、主観レベルマシンアンラーニングを通して研究する。
すべての被験者を対象に訓練されたベースラインから、モデルに依存したプロキシを用いて候補有害被験者をランク付けし、軽量な近似的未学習更新を適用し、保持対象者のみにスクラッチから再訓練されたオラクルモデルと比較する。
我々は、このプロトコルをTensor-Convolution and Convolution-Transformer Network (TCCT-Net) を固定プラットフォームとしてDAiSEEおよびEngageNet上でインスタンス化し、同じ除去シナリオで一致する3つのモデル状態(ベースライン、未学習、オラクル)を評価する。
典型的な K=3 の忘れセット設定では、未学習のモデルは、EngageNet と DAiSEE におけるオラクルゲインの89.3%と92.5%を、約4分の1のトレーニングコストで回復する。
被検者レベルの未学習は, 被検者選択の質や除去の態勢に左右されるが, 有効性は, 被検者選択の質や除去の態勢に左右される。
関連論文リスト
- PRUNE: A Patching Based Repair Framework for Certifiable Unlearning of Neural Networks [6.251501206858703]
トレーニングされたニューラルネットワークモデルからトレーニングデータの特定の部分(すなわち未学習)を取り除くことが望ましい。
既存のアンラーニング手法では、残ったデータで代替モデルを訓練する。
我々は、要求されたデータのターゲットの「偽造」を除去するために、元のニューラルネットワークに慎重に構築された「パッチ」を付与して、新しいアンラーニングアプローチを提案する。
論文 参考訳(メタデータ) (2025-05-10T05:35:08Z) - Are We Truly Forgetting? A Critical Re-examination of Machine Unlearning Evaluation Protocols [14.961054239793356]
本稿では,下流のタスククラスと意味的類似性を示すクラスを忘れる,厳密なアンラーニング評価手法を提案する。
われわれのベンチマークは、現実的な条件下での未学習アルゴリズム評価のための標準化されたプロトコルとして機能することを願っている。
論文 参考訳(メタデータ) (2025-03-10T07:11:34Z) - UPCORE: Utility-Preserving Coreset Selection for Balanced Unlearning [57.081646768835704]
ユーザ仕様や法的フレームワークは、しばしば、大きな言語モデル(LLM)を含む、事前訓練されたモデルから削除される情報を必要とする。
これは、既に訓練済みのモデルからデータポイントのセットを削除または"偽造"する必要がある。
本研究では,非学習時の副次的損傷を軽減するための手法に依存しないデータ選択フレームワークUPCOREを提案する。
論文 参考訳(メタデータ) (2025-02-20T22:51:10Z) - Incremental Self-training for Semi-supervised Learning [56.57057576885672]
ISTは単純だが有効であり、既存の自己学習に基づく半教師あり学習手法に適合する。
提案したISTを5つのデータセットと2種類のバックボーンで検証し,認識精度と学習速度を効果的に向上させる。
論文 参考訳(メタデータ) (2024-04-14T05:02:00Z) - Partially Blinded Unlearning: Class Unlearning for Deep Networks a Bayesian Perspective [4.31734012105466]
マシン・アンラーニング(英: Machine Unlearning)とは、特定のデータセットやクラスに指定された情報を事前訓練されたモデルから選択的に破棄するプロセスである。
本研究では,事前学習した分類ネットワークから,特定の種類のデータに関連付けられた情報の目的的除去に適した手法を提案する。
本手法は,従来の最先端の未学習手法を超越し,優れた有効性を示す。
論文 参考訳(メタデータ) (2024-03-24T17:33:22Z) - Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Machine Unlearning of Features and Labels [72.81914952849334]
機械学習モデルにおけるアンラーニングとラベルのファーストシナリオを提案する。
提案手法は,影響関数の概念に基づいて,モデルパラメータのクローズドフォーム更新によるアンラーニングを実現する。
論文 参考訳(メタデータ) (2021-08-26T04:42:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。