Fugu-MT 論文翻訳(概要): Understanding and Mitigating Classification Errors Through Interpretable Token Patterns

論文の概要: Understanding and Mitigating Classification Errors Through Interpretable Token Patterns

arxiv url: http://arxiv.org/abs/2311.10920v1
Date: Sat, 18 Nov 2023 00:24:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-22 13:32:20.150009
Title: Understanding and Mitigating Classification Errors Through Interpretable Token Patterns
Title（参考訳）: 解釈可能なトークンパターンによる分類誤りの理解と緩和
Authors: Michael A. Hedderich, Jonas Fischer, Dietrich Klakow, Jilles Vreeken
Abstract要約: 容易に解釈可能な用語でエラーを特徴付けることは、分類器が体系的なエラーを起こす傾向にあるかどうかを洞察する。正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。提案手法であるPremiseが実際によく動作することを示す。
参考スコア（独自算出の注目度）: 58.91023283103762
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: State-of-the-art NLP methods achieve human-like performance on many tasks, but make errors nevertheless. Characterizing these errors in easily interpretable terms gives insight into whether a classifier is prone to making systematic errors, but also gives a way to act and improve the classifier. We propose to discover those patterns of tokens that distinguish correct and erroneous predictions as to obtain global and interpretable descriptions for arbitrary NLP classifiers. We formulate the problem of finding a succinct and non-redundant set of such patterns in terms of the Minimum Description Length principle. Through an extensive set of experiments, we show that our method, Premise, performs well in practice. Unlike existing solutions, it recovers ground truth, even on highly imbalanced data over large vocabularies. In VQA and NER case studies, we confirm that it gives clear and actionable insight into the systematic errors made by NLP classifiers.
Abstract（参考訳）: 最先端のNLP手法は、多くのタスクにおいて人間のような性能を達成するが、それでもエラーを犯す。これらの誤りを容易に解釈可能な言葉で特徴づけることは、分類器が体系的な誤りを犯しやすいかという洞察を与えるだけでなく、分類器の動作と改善の方法を与える。我々は,任意のNLP分類器のグローバルかつ解釈可能な記述を得るために,正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。最小記述長原理を用いて,そのようなパターンの簡潔かつ非冗長な集合を求める問題を定式化する。広範囲にわたる実験を通じて,本手法の前提条件が実効性があることを実証する。既存の解とは異なり、大きな語彙上で高度に不均衡なデータであっても、基礎的な真理を回復する。 VQA と NER のケーススタディでは,NLP 分類器による系統的誤りについて,明確かつ実用的な知見が得られた。

関連論文リスト

Error Classification of Large Language Models on Math Word Problems: A Dynamically Adaptive Framework [64.83955753606443]
数学の単語問題は、大規模言語モデルの推論能力を評価するための重要なベンチマークとなる。現在のエラー分類法は静的および事前定義されたカテゴリに依存している。 MWPES-300Kは,304,865個のエラーサンプルを含む包括的データセットである。
論文参考訳（メタデータ） (2025-01-26T16:17:57Z)
Subtle Errors Matter: Preference Learning via Error-injected Self-editing [59.405145971637204]
eRror-Injected Self-Editing (RISE) と呼ばれる新しい好み学習フレームワークを提案する。 RISEは定義済みの微妙な誤りを正しい解の部分的なトークンに注入し、エラー軽減のためにハードペアを構築する。 RISEの有効性を検証する実験では、Qwen2-7B-Instructでは、GSM8Kでは3.0%、MATHでは7.9%が顕著に改善された。
論文参考訳（メタデータ） (2024-10-09T07:43:38Z)
XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。 XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。 6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文参考訳（メタデータ） (2023-10-09T08:07:04Z)
Probabilistic Safety Regions Via Finite Families of Scalable Classifiers [2.431537995108158]
監視された分類は、データのパターンを認識して、振る舞いのクラスを分離する。正準解は、機械学習の数値近似の性質に固有の誤分類誤差を含む。本稿では,確率論的安全性領域の概念を導入し,入力空間のサブセットとして,誤分類されたインスタンスの数を確率論的に制御する手法を提案する。
論文参考訳（メタデータ） (2023-09-08T22:40:19Z)
Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文参考訳（メタデータ） (2023-06-19T18:25:44Z)
Personalized Interpretable Classification [6.694135469324352]
我々は、新たなデータマイニング問題として、パーソナライズされた解釈可能な分類を正式に導入する第一歩を踏み出します。個々のテストサンプルに対してパーソナライズされたルールを識別するために,PICというグリージーなアルゴリズムを提案する。我々のアルゴリズムは、最先端のSOTA(State-of-the-art)の解釈と同じレベルの予測精度を達成できる。
論文参考訳（メタデータ） (2023-02-06T01:59:16Z)
Label-Descriptive Patterns and their Application to Characterizing Classification Errors [31.272875287136426]
最先端のディープラーニング手法は多くのタスクで人間のようなパフォーマンスを達成するが、それでもエラーを犯す。これらのエラーを容易に解釈可能な言葉で特徴付けることは、モデルが体系的なエラーを起こす傾向にあるかどうかの洞察を与えるだけでなく、モデルを実行し改善する方法を与える。本稿では,予測の正しさに応じて分割された入力データを簡潔に記述するパターンの小さなセットをマイニングすることにより,任意の分類器に対して,任意の分類を行うことができる手法を提案する。
論文参考訳（メタデータ） (2021-10-18T19:42:21Z)
Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文参考訳（メタデータ） (2020-10-05T22:13:21Z)
Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文参考訳（メタデータ） (2020-06-22T21:12:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。