論文の概要: Why is the prediction wrong? Towards underfitting case explanation via
meta-classification
- arxiv url: http://arxiv.org/abs/2302.09952v1
- Date: Mon, 20 Feb 2023 12:40:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 15:23:51.033723
- Title: Why is the prediction wrong? Towards underfitting case explanation via
meta-classification
- Title(参考訳): なぜ予測が間違っているのか?
メタ分類による不適合事例説明に向けて
- Authors: Sheng Zhou (CEDRIC - VERTIGO, CNAM, LADIS), Pierre Blanchart (LADIS),
Michel Crucianu (CEDRIC - VERTIGO, CNAM), Marin Ferecatu (CEDRIC - VERTIGO,
CNAM)
- Abstract要約: 我々は欠陥データを手作り中間表現(メタ表現、プロファイルベクトル)に投影する。
本稿では,メタ分類器(決定木)を適合させ,その出力を解釈可能な(人間の可読性)説明規則の集合として表現する手法を提案する。
いくつかの実データを用いた実験の結果,80%以上の診断精度が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we present a heuristic method to provide individual
explanations for those elements in a dataset (data points) which are wrongly
predicted by a given classifier. Since the general case is too difficult, in
the present work we focus on faulty data from an underfitted model. First, we
project the faulty data into a hand-crafted, and thus human readable,
intermediate representation (meta-representation, profile vectors), with the
aim of separating the two main causes of miss-classification: the classifier is
not strong enough, or the data point belongs to an area of the input space
where classes are not separable. Second, in the space of these profile vectors,
we present a method to fit a meta-classifier (decision tree) and express its
output as a set of interpretable (human readable) explanation rules, which
leads to several target diagnosis labels: data point is either correctly
classified, or faulty due to a too weak model, or faulty due to mixed
(overlapped) classes in the input space. Experimental results on several real
datasets show more than 80% diagnosis label accuracy and confirm that the
proposed intermediate representation allows to achieve a high degree of
invariance with respect to the classifier used in the input space and to the
dataset being classified, i.e. we can learn the metaclassifier on a dataset
with a given classifier and successfully predict diagnosis labels for a
different dataset or classifier (or both).
- Abstract(参考訳): 本稿では,与えられた分類器によって誤って予測されるデータセット(データポイント)内の要素について,個々の説明を提供するヒューリスティックな手法を提案する。
一般的なケースは難しいので、本研究では、不適切なモデルからのデータに焦点を合わせます。
まず, 故障データを手作りの中間表現(メタ表現, プロファイルベクトル)に投影し, 分類器の強度が十分でないか, あるいはデータポイントがクラスが分離できない入力空間の領域に属するかの2つの主な原因を分離する。
次に、これらのプロファイルベクトルの空間において、メタ分類器(決定木)に適合し、その出力を解釈可能な(可読性のある)説明規則のセットとして表現する手法を示し、いくつかのターゲット診断ラベルに導く。
いくつかの実データセットにおける実験結果は、80%以上の診断ラベル精度を示し、提案中間表現により、入力空間で使用される分類器および分類対象データセットに対する高い不変性、すなわち、所定の分類器でデータセット上のメタ分類器を学習し、異なるデータセットまたは分類器(またはその両方)の診断ラベルをうまく予測できることを確認した。
関連論文リスト
- A method for classification of data with uncertainty using hypothesis testing [0.0]
不確実性を定量化し、それを考慮に入れた意思決定アプローチを採用する必要がある。
2種類の仮説テストを用いた新しい意思決定手法を提案する。
この方法は、2つのクラス分布の重なり合う領域に属するあいまいなデータを検出することができる。
論文 参考訳(メタデータ) (2025-02-12T17:14:07Z) - Evaluating multiple models using labeled and unlabeled data [8.174722982389259]
Semi-Supervised Model Evaluation (SSME) は、ラベル付きデータとラベルなしデータの両方を用いて機械学習分類器を評価する手法である。
本研究では,(1)医療,(2)コンテンツモデレーション,(3)分子特性予測,(4)画像アノテーションの4つの領域において,ラベル付きデータセットの取得が非現実的であることを示す。
その結果,SSMEは競合する手法よりも精度が高く,ラベル付きデータのみを用いた場合に比べて誤差が5.1倍,競合する手法では2.4倍減少することがわかった。
論文 参考訳(メタデータ) (2025-01-21T03:47:37Z) - Balancing Fairness and Accuracy in Data-Restricted Binary Classification [14.439413517433891]
本稿では,4つの実践シナリオ下での精度と公平性のトレードオフをモデル化する枠組みを提案する。
3つのデータセットの実験では、トレードオフを定量化するためのツールとして提案されたフレームワークの有用性が示されている。
論文 参考訳(メタデータ) (2024-03-12T15:01:27Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - Classification at the Accuracy Limit -- Facing the Problem of Data
Ambiguity [0.0]
データカテゴリの重複から生じる分類精度の理論的限界を示す。
睡眠中のMNISTとヒト脳波記録を用いて、教師なしおよび教師なしのトレーニングによって生成された新しいデータ埋め込みを比較した。
これは、手書き数字や睡眠段階などの人間定義カテゴリーを「自然種」とみなすことができることを示唆している。
論文 参考訳(メタデータ) (2022-06-04T07:00:32Z) - Is the Performance of My Deep Network Too Good to Be True? A Direct
Approach to Estimating the Bayes Error in Binary Classification [86.32752788233913]
分類問題において、ベイズ誤差は、最先端の性能を持つ分類器を評価するための基準として用いられる。
我々はベイズ誤差推定器を提案する。そこでは,クラスの不確かさを示すラベルの平均値のみを評価できる。
我々の柔軟なアプローチは、弱い教師付きデータであってもベイズ誤差を推定できる。
論文 参考訳(メタデータ) (2022-02-01T13:22:26Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Evaluating Fairness of Machine Learning Models Under Uncertain and
Incomplete Information [25.739240011015923]
属性分類器のテスト精度は下流モデルにおけるバイアス推定の有効性と常に相関しているとは限らない。
我々の分析は,属性分類器の誤りを可能な限り不均一に分配したいという状況において,意外かつ直感的な意味を持っている。
論文 参考訳(メタデータ) (2021-02-16T19:02:55Z) - Unsupervised Label Refinement Improves Dataless Text Classification [48.031421660674745]
データレステキスト分類は、ラベル記述と組み合わせた文書にスコアを割り当てることで、文書を未確認のラベルに分類することができる。
有望ながら、それは重要なダウンストリームタスクごとにラベルセットの正確な説明に依存します。
この依存により、データレス分類器はラベル記述の選択に非常に敏感になり、実際にはデータレス分類の幅広い適用を妨げる。
論文 参考訳(メタデータ) (2020-12-08T03:37:50Z) - Learning with Out-of-Distribution Data for Audio Classification [60.48251022280506]
我々は,OODインスタンスを破棄するよりも,特定のOODインスタンスを検出・復号化することで,学習に肯定的な影響を及ぼすことを示す。
提案手法は,畳み込みニューラルネットワークの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-02-11T21:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。