Fugu-MT 論文翻訳(概要): ELODI: Ensemble Logit Difference Inhibition for Positive-Congruent Training

論文の概要: ELODI: Ensemble Logit Difference Inhibition for Positive-Congruent Training

arxiv url: http://arxiv.org/abs/2205.06265v1
Date: Thu, 12 May 2022 17:59:56 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-13 13:37:53.709124
Title: ELODI: Ensemble Logit Difference Inhibition for Positive-Congruent Training
Title（参考訳）: ELODI:Positive-Congruent Trainingのためのロジット差分抑制
Authors: Yue Zhao, Yantao Shen, Yuanjun Xiong, Shuo Yang, Wei Xia, Zhuowen Tu, Bernt Shiele, Stefano Soatto
Abstract要約: 負のフリップは、レガシーモデルを新しいものに置き換えた場合に、分類システムで発生するエラーである。本稿では,単一モデルの推論コストにおいて,誤り率とNFRの両方のパフォーマンスをパラゴンで達成する分類システムを訓練する手法を提案する。
参考スコア（独自算出の注目度）: 94.89729728865507
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Negative flips are errors introduced in a classification system when a legacy model is replaced with a new one. Existing methods to reduce the negative flip rate (NFR) either do so at the expense of overall accuracy using model distillation, or use ensembles, which multiply inference cost prohibitively. We present a method to train a classification system that achieves paragon performance in both error rate and NFR, at the inference cost of a single model. Our method introduces a generalized distillation objective, Logit Difference Inhibition (LDI), that penalizes changes in the logits between the new and old model, without forcing them to coincide as in ordinary distillation. LDI affords the model flexibility to reduce error rate along with NFR. The method uses a homogeneous ensemble as the reference model for LDI, hence the name Ensemble LDI, or ELODI. The reference model can then be substituted with a single model at inference time. The method leverages the observation that negative flips are typically not close to the decision boundary, but often exhibit large deviations in the distance among their logits, which are reduced by ELODI.
Abstract（参考訳）: 負のフリップは、レガシーモデルを新しいものに置き換えた場合に、分類システムで発生するエラーである。正フリップ率(NFR)を下げる既存の方法は、モデル蒸留による全体的な精度を犠牲にするか、推論コストを禁ずるアンサンブルを使用するかのいずれかである。本稿では,単一モデルの推論コストにおいて,誤り率とNFRの両方でパラゴン性能を実現する分類システムを訓練する方法を提案する。本研究では, 一般蒸留目的であるロジット差抑制法(ldi)を導入し, 通常の蒸留法と一致させることなく, 新旧モデル間のロジットの変化をペナライズする。 LDIは、NFRとともにエラー率を減らすためのモデル柔軟性を提供する。この方法はLDIの参照モデルとして同質アンサンブルを使用するため、Ensemble LDI(ELODI)と呼ばれる。参照モデルは、推論時に単一のモデルに置換することができる。この手法では、負のフリップは一般に決定境界に近づかないが、エローディによって減少するロジット間の距離の偏差が大きいという観測を活用している。

関連論文リスト

Toward Reliable Machine Unlearning: Theory, Algorithms, and Evaluation [1.7767466724342065]
本稿では,SOTA MIAスコアに基づく画像分類の最先端手法を超越したAdrial Machine UNlearning(AMUN)を提案する。既存の手法は、最寄りの会員推定攻撃(MIA-NN)を導入して、再訓練されたモデルの動作を再現できないことを示す。そこで我々は,スクラッチから再学習したモデルが生成する残りのクラスに対する分布を,クラス入力に対して近似することで,このリークを緩和する微調整対象を提案する。
論文参考訳（メタデータ） (2025-12-07T20:57:25Z)
Mitigating Negative Flips via Margin Preserving Training [30.10471850093451]
AIシステムの連続バージョン間の矛盾を最小限に抑えることは、全体的なエラーを減らすのと同じくらい重要である。画像分類において、そのような矛盾は負のフリップとして現れ、更新されたモデルは以前に正しく分類されたテストサンプルを誤って分類する。本稿では,改良版を学習しながら,オリジナルモデルのマージンを保存する新しい手法を提案する。
論文参考訳（メタデータ） (2025-11-11T14:53:52Z)
UPCORE: Utility-Preserving Coreset Selection for Balanced Unlearning [57.081646768835704]
ユーザ仕様や法的フレームワークは、しばしば、大きな言語モデル(LLM)を含む、事前訓練されたモデルから削除される情報を必要とする。これは、既に訓練済みのモデルからデータポイントのセットを削除または"偽造"する必要がある。本研究では,非学習時の副次的損傷を軽減するための手法に依存しないデータ選択フレームワークUPCOREを提案する。
論文参考訳（メタデータ） (2025-02-20T22:51:10Z)
Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文参考訳（メタデータ） (2024-03-01T03:27:08Z)
Bias Mitigating Few-Shot Class-Incremental Learning [17.185744533050116]
クラス増分学習は,限定された新規クラスサンプルを用いて,新規クラスを継続的に認識することを目的としている。最近の手法では,段階的なセッションで特徴抽出器を微調整することにより,ベースクラスとインクリメンタルクラスの精度の不均衡を緩和している。本研究では,FSCIL問題におけるモデルバイアスを緩和する新しい手法を提案する。
論文参考訳（メタデータ） (2024-02-01T10:37:41Z)
Regularizing with Pseudo-Negatives for Continual Self-Supervised Learning [62.40718385934608]
効果的な継続型自己教師型学習(CSSL)のためのPNR(Pseudo-Negative Regularization)フレームワークを提案する。我々のPNRは,新たに学習した表現が過去の学習と矛盾しないように,モデルに基づく拡張によって得られた擬陰性情報を活用する。
論文参考訳（メタデータ） (2023-06-08T10:59:35Z)
Self-Damaging Contrastive Learning [92.34124578823977]
ラベルのないデータは一般に不均衡であり、長い尾の分布を示す。本稿では,クラスを知らずに表現学習を自動的にバランスをとるための,自己学習コントラスト学習という原則的枠組みを提案する。実験の結果,SDCLRは全体としての精度だけでなく,バランス性も著しく向上することがわかった。
論文参考訳（メタデータ） (2021-06-06T00:04:49Z)
Churn Reduction via Distillation [54.5952282395487]
本研究は, 基礎モデルを教師として用いた蒸留によるトレーニングと, 予測的チャーンに対する明示的な制約によるトレーニングとの等価性を示す。次に, 蒸留が近年の多くのベースラインに対する低チャーン訓練に有効であることを示す。
論文参考訳（メタデータ） (2021-06-04T18:03:31Z)
Positive-Congruent Training: Towards Regression-Free Model Updates [87.25247195148187]
画像分類において、サンプルワイドの不整合は「負のフリップ」として現れる新しいモデルは、古い(参照)モデルによって正しく分類されたテストサンプルの出力を誤って予測する。そこで本研究では,PC トレーニングのための簡易なアプローチである Focal Distillation を提案する。
論文参考訳（メタデータ） (2020-11-18T09:00:44Z)
Counterfactual fairness: removing direct effects through regularization [0.0]
制御ダイレクトエフェクト(CDE)による因果関係を考慮したフェアネスの新たな定義を提案する。我々は古典的公正度対策に取り組むための正規化を開発し、新しい公正度定義を満たす因果正則化を示す。その結果,モデル性能を低下させることなく,予測から不公平さを軽減できることが判明した。
論文参考訳（メタデータ） (2020-02-25T10:13:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。