Fugu-MT 論文翻訳(概要): NegMerge: Consensual Weight Negation for Strong Machine Unlearning

論文の概要: NegMerge: Consensual Weight Negation for Strong Machine Unlearning

arxiv url: http://arxiv.org/abs/2410.05583v1
Date: Tue, 8 Oct 2024 00:50:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-01 17:48:36.358390
Title: NegMerge: Consensual Weight Negation for Strong Machine Unlearning
Title（参考訳）: NegMerge: 強力な機械学習のための合意的ウェイトネゲーション
Authors: Hyoseo Kim, Dongyoon Han, Junsuk Choe,
Abstract要約: 機械学習は、モデルから特定の知識を選択的に除去することを目的としている。現在の手法は、左折セットの微調整モデルに依存し、タスクベクトルを生成し、元のモデルからそれを減算する。 1つのモデルを選択するのではなく、与えられた細調整されたモデルをすべて活用する新しい手法を提案する。
参考スコア（独自算出の注目度）: 21.081262106431506
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Machine unlearning aims to selectively remove specific knowledge from a model. Current methods, such as task arithmetic, rely on fine-tuning models on the forget set, generating a task vector, and subtracting it from the original model. However, we argue the effectiveness of this approach is highly sensitive to hyperparameter selection, necessitating careful validation to identify the best model among many fine-tuned candidates. In this paper, we propose a novel method that leverages all given fine-tuned models rather than selecting a single one. By constructing task vectors from models trained with varied hyperparameters and merging only the components of the task vectors with consistent signs, we perform unlearning by negating the merged task vector from the original model. Given that existing methods also utilize multiple fine-tuned models, our approach delivers more effective unlearning without incurring additional computational costs. We demonstrate the effectiveness of our method on both vision-language models and standard image classification models, showing improved unlearning performance with minimal degradation on the retain set, outperforming state-of-the-art techniques.
Abstract（参考訳）: 機械学習は、モデルから特定の知識を選択的に除去することを目的としている。タスク演算のような現在の手法は、タスクベクトルを生成し、元のモデルからそれを減らし、リクットセットの微調整モデルに依存している。しかし,本手法の有効性はハイパーパラメータ選択に非常に敏感であり,多くの微調整候補の中から最適なモデルを特定するためには,慎重に検証する必要がある。本稿では,1つのモデルを選択するのではなく,与えられたすべての微調整モデルを活用する新しい手法を提案する。様々なハイパーパラメータで訓練されたモデルからタスクベクトルを構築し、一貫した符号でタスクベクトルの構成要素のみをマージすることにより、元のモデルからマージされたタスクベクトルを無効にすることで未学習を行う。既存の手法は複数の微調整モデルも利用しているため、計算コストを増大させることなく、より効果的な未学習を実現することができる。本手法が視覚言語モデルと標準画像分類モデルの両方において有効であることを示す。

関連論文リスト

Purifying Task Vectors in Knowledge-Aware Subspace for Model Merging [83.5273168208788]
モデルマージは、個別に調整されたモデルのタスク固有の能力を、余分なトレーニングなしで単一のモデルに統合することを目的としている。統合モデルは、タスクベクトルのタスク非関連冗長性に起因する競合により、しばしば顕著なパフォーマンス劣化に悩まされる。本稿では,これらの課題を克服するために,知識対応サブ空間におけるTAsk Vectors (PAVE) の純粋化を提案する。
論文参考訳（メタデータ） (2025-10-16T14:02:57Z)
Gradient-Sign Masking for Task Vector Transport Across Pre-Trained Models [25.83401080149413]
転送を成功させる鍵は、新しいモデルの勾配の符号構造にあることを示す。理想的な勾配符号構造を近似する新しい手法であるGradFixを提案する。視覚と言語ベンチマークにおいて大きなパフォーマンス向上を示す。
論文参考訳（メタデータ） (2025-10-07T13:30:25Z)
Sharpness-Aware Parameter Selection for Machine Unlearning [6.397490580631141]
クレジットカード番号やパスワードなど、機密性の高い個人情報が誤って機械学習モデルのトレーニングに組み込まれており、その後削除する必要がある場合が多い。この問題に対処するために、文献に様々な機械学習技術が提案されている。提案手法のほとんどは、トレーニングされたモデルから個々のデータサンプルを除去するものである。これらのタスクの既存の方法は、モデルパラメータの集合全体またはモデルの最後の層のみを更新することで、未学習タスクを行うが、未学習ターゲット機能に最も貢献するモデルパラメータのサブセットが存在することを示す。
論文参考訳（メタデータ） (2025-04-08T19:41:07Z)
Modeling Multi-Task Model Merging as Adaptive Projective Gradient Descent [74.02034188307857]
複数のエキスパートモデルをマージすることは、元のデータにアクセスせずにマルチタスク学習を実行するための有望なアプローチを提供する。既存の手法は必然的にタスク固有の情報を破棄し、競合の原因となっているが、パフォーマンスには不可欠である。我々の手法は従来の手法より一貫して優れており、視覚領域とNLP領域の両方において様々なアーキテクチャやタスクにまたがって最先端の結果が得られます。
論文参考訳（メタデータ） (2025-01-02T12:45:21Z)
Forget Vectors at Play: Universal Input Perturbations Driving Machine Unlearning in Image Classification [25.721619048573203]
マシン・アンラーニング(MU)は、既に訓練されたモデルから不要な特定のデータの影響を消そうとする。本研究では,新しい入力ベースの観点からMU問題にアプローチする。我々は,能動的入力に基づく非学習戦略の存在を実演する。
論文参考訳（メタデータ） (2024-12-21T21:27:22Z)
Multi-Task Model Merging via Adaptive Weight Disentanglement [69.7292615212444]
モデルマージのための適応重み分散法を提案する。余剰ベクトルの抽出に成功し, 減算後, タスクベクトルは頑健な性能を維持した。
論文参考訳（メタデータ） (2024-11-27T20:08:55Z)
Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文参考訳（メタデータ） (2024-10-30T17:20:10Z)
MUSO: Achieving Exact Machine Unlearning in Over-Parameterized Regimes [19.664090734076712]
マシン・アンラーニング(MU)は、訓練されたモデルを特定のデータでトレーニングされたことがないかのように振る舞う。本研究では,学習と学習のタスクを統一する交互最適化アルゴリズムを提案する。このアルゴリズムの有効性は、数値実験によって確認され、様々なシナリオにおける未学習における優れた性能を強調している。
論文参考訳（メタデータ） (2024-10-11T06:17:17Z)
Is Tokenization Needed for Masked Particle Modelling? [8.79008927474707]
Masked Particle Modeling (MPM) は、無順序集合の表現表現を構築するための自己教師付き学習スキームである。実装における非効率に対処し、より強力なデコーダを組み込むことにより、MPMを改善する。これらの新しい手法は、ジェットの基礎モデルのための新しいテストベッドにおいて、オリジナルのMPMからのトークン化学習目標よりも優れていることを示す。
論文参考訳（メタデータ） (2024-09-19T09:12:29Z)
Enabling Small Models for Zero-Shot Classification through Model Label Learning [50.68074833512999]
モデルと機能の間のギャップを埋める新しいパラダイムであるモデルラベル学習(MLL)を導入する。 7つの実世界のデータセットの実験により、MLLの有効性と効率が検証された。
論文参考訳（メタデータ） (2024-08-21T09:08:26Z)
Pre-Trained Vision-Language Models as Partial Annotators [40.89255396643592]
事前学習された視覚言語モデルは、画像と自然言語の統一表現をモデル化するために大量のデータを学習する。本稿では,事前学習型モデルアプリケーションのための「事前学習型-弱教師付き学習」パラダイムについて検討し,画像分類タスクの実験を行う。
論文参考訳（メタデータ） (2024-05-23T17:17:27Z)
Exploring Transferability for Randomized Smoothing [37.60675615521106]
本稿では,頑健なモデルを事前学習する手法を提案する。クリーンな画像のみを微調整しても、驚くほど強力な認証精度が得られます。
論文参考訳（メタデータ） (2023-12-14T15:08:27Z)
Parameter Efficient Multi-task Model Fusion with Partial Linearization [97.23530944186078]
パラメータ効率のよい微調整技術において,マルチタスク融合を改善する新しい手法を提案する。提案手法は, アダプタモジュールのみを部分的に線形化し, 線形化アダプタにタスク演算を適用する。我々の部分線形化手法は、複数のタスクをより効果的に1つのモデルに融合させることを可能にしている。
論文参考訳（メタデータ） (2023-10-07T08:55:54Z)
Dual Student Networks for Data-Free Model Stealing [79.67498803845059]
主な課題は、パラメータにアクセスせずにターゲットモデルの勾配を推定し、多様なトレーニングサンプルを生成することである。そこで本研究では,2人の学生が左右対称に学習し,学生が反対するサンプルを生成するための基準を提案する。我々の新しい最適化フレームワークは、目標モデルのより正確な勾配推定と、ベンチマーク分類データセットの精度向上を提供する。
論文参考訳（メタデータ） (2023-09-18T18:11:31Z)
Evaluating Representations with Readout Model Switching [19.907607374144167]
本稿では,最小記述長(MDL)の原理を用いて評価指標を考案する。我々は、読み出しモデルのためのハイブリッド離散および連続値モデル空間を設計し、それらの予測を組み合わせるために切替戦略を用いる。提案手法はオンライン手法で効率的に計算でき,様々なアーキテクチャの事前学習された視覚エンコーダに対する結果を示す。
論文参考訳（メタデータ） (2023-02-19T14:08:01Z)
Contextual Active Model Selection [10.925932167673764]
本稿では,ラベル付けコストを最小限に抑えつつ,事前学習したモデルを積極的に選択する手法を提案する。目的は、ラベル要求を制限しながら予測を行う最良のモデルを適応的に選択することである。 2つの新しいコンポーネントに依存した文脈的アクティブモデル選択アルゴリズムであるCAMSを提案する。
論文参考訳（メタデータ） (2022-07-13T08:22:22Z)
Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文参考訳（メタデータ） (2022-03-28T21:15:32Z)
Model-Agnostic Multitask Fine-tuning for Few-shot Vision-Language Transfer Learning [59.38343286807997]
未知タスクの視覚言語モデルのためのモデル非依存型マルチタスクファインチューニング(MAMF)を提案する。モデルに依存しないメタラーニング(MAML)と比較して、MAMFは二段階最適化を捨て、一階勾配のみを使用する。 MAMFは5つのベンチマークデータセット上で、数ショットの転送学習において古典的な微調整法よりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2022-03-09T17:26:53Z)
Few-shot Learning for Unsupervised Feature Selection [59.75321498170363]
教師なし特徴選択のための数ショット学習法を提案する。提案手法では,未ラベルのターゲットインスタンスがいくつかある場合,対象タスクで関連する特徴のサブセットを選択することができる。提案手法が既存の特徴選択法より優れていることを示す。
論文参考訳（メタデータ） (2021-07-02T03:52:51Z)
Reinforced Multi-Teacher Selection for Knowledge Distillation [54.72886763796232]
知識蒸留はモデル圧縮の一般的な方法です。現在の方法は、蒸留全体の教師モデルに固定重量を割り当てます。既存のメソッドのほとんどは、すべての教師モデルに等しい重みを割り当てます。本論文では,学習例の複雑性や生徒モデル能力の違いから,教師モデルとの違いを学習することで,生徒モデルの蒸留性能の向上が期待できることを考察する。
論文参考訳（メタデータ） (2020-12-11T08:56:39Z)
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks [133.93803565077337]
検索強化生成モデルは、事前訓練されたパラメトリックメモリと非パラメトリックメモリを組み合わせて言語生成を行う。我々は、RAGモデルが、最先端パラメトリックのみのセク2セックベースラインよりも、より具体的で、多様で、現実的な言語を生成することを示す。
論文参考訳（メタデータ） (2020-05-22T21:34:34Z)
ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators [108.3381301768299]
Masked Language Modeling (MLM) は、BERT のような事前学習手法で、いくつかのトークンを [MASK] に置き換えて、元のトークンを再構築するためにモデルをトレーニングすることで入力を破損させた。代用トークン検出という,より効率的な事前学習タスクを提案する。
論文参考訳（メタデータ） (2020-03-23T21:17:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。