論文の概要: Rule Mining for Correcting Classification Models
- arxiv url: http://arxiv.org/abs/2310.06446v1
- Date: Tue, 10 Oct 2023 09:17:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 01:59:22.403757
- Title: Rule Mining for Correcting Classification Models
- Title(参考訳): 分類モデルの修正のためのルールマイニング
- Authors: Hirofumi Suzuki, Hiroaki Iwashita, Takuya Takagi, Yuta Fujishige,
Satoshi Hara
- Abstract要約: 予測精度が一貫して高いことを保証するためには、機械学習モデルを継続的に更新または修正する必要がある。
本研究では,モデル修正による予測結果の変更に注意すべきシナリオについて考察する。
我々は、頻繁なアイテムセットマイニングと修正ルールのための独自のプルーニング技術を組み合わせた効率的な修正ルールマイニングアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 11.493324381325303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning models need to be continually updated or corrected to ensure
that the prediction accuracy remains consistently high. In this study, we
consider scenarios where developers should be careful to change the prediction
results by the model correction, such as when the model is part of a complex
system or software. In such scenarios, the developers want to control the
specification of the corrections. To achieve this, the developers need to
understand which subpopulations of the inputs get inaccurate predictions by the
model. Therefore, we propose correction rule mining to acquire a comprehensive
list of rules that describe inaccurate subpopulations and how to correct them.
We also develop an efficient correction rule mining algorithm that is a
combination of frequent itemset mining and a unique pruning technique for
correction rules. We observed that the proposed algorithm found various rules
which help to collect data insufficiently learned, directly correct model
outputs, and analyze concept drift.
- Abstract(参考訳): 予測精度が一貫して高いことを保証するためには、機械学習モデルを継続的に更新または修正する必要がある。
本研究では,モデルが複雑なシステムやソフトウェアの一部である場合など,モデル修正によって予測結果を変更することを注意すべきシナリオを検討する。
このようなシナリオでは、開発者は修正の仕様を制御したい。
これを達成するためには、入力のどのサブポピュレーションがモデルによって不正確な予測を受けるかを理解する必要がある。
そこで本研究では,不正確な亜集団を記述した規則の包括的リストを取得するために,補正規則マイニングを提案する。
また、頻繁なアイテムセットマイニングと、補正ルールに対するユニークなプルーニング技術を組み合わせた効率的な補正ルールマイニングアルゴリズムを開発した。
提案アルゴリズムは,学習したデータを収集し,モデル出力を直接補正し,概念ドリフトを解析するための様々なルールを発見した。
関連論文リスト
- Normalizing Flows for Conformal Regression [0.0]
Conformal Prediction (CP)アルゴリズムは、ラベル付きデータに基づいて出力を校正することで予測モデルの不確実性を推定する。
キャリブレーション過程をトレーニングすることで、間隔をローカライズする一般的なスキームを提案する。
PapadopoulosらによるError Reweighting CPアルゴリズム(2008年)とは異なり、このフレームワークは名目と経験的条件の妥当性のギャップを推定できる。
論文 参考訳(メタデータ) (2024-06-05T15:04:28Z) - Conformal online model aggregation [29.43493007296859]
本稿では,オンライン環境における共形モデルアグリゲーションへの新たなアプローチを提案する。
これは、過去の性能に基づいてモデルの重みが時間とともに適応される投票によって、いくつかのアルゴリズムの予測セットを組み合わせることに基づいている。
論文 参考訳(メタデータ) (2024-03-22T15:40:06Z) - Orthogonal Gradient Boosting for Simpler Additive Rule Ensembles [10.40809014729148]
予測規則のグラディエント向上は、潜在的に解釈可能で正確な確率モデルを学ぶための効率的なアプローチである。
本稿では, リスク勾配ベクトルと条件出力ベクトルの射影との角度を, 既に選択された条件の補数に対して測定する方法を示す。
このアプローチは、リスク勾配自体をモデルに追加する理想的な更新を正しく近似し、より一般的でより短いルールを含めることを好んでいる。
論文 参考訳(メタデータ) (2024-02-24T02:29:10Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Predicting generalization performance with correctness discriminators [64.00420578048855]
未確認データに対して,金のラベルを必要とせず,精度の上下境界を確立する新しいモデルを提案する。
予測された上境界と下限の間に金の精度が確実に成立する様々なタグ付け、構文解析、意味解析タスクを示す。
論文 参考訳(メタデータ) (2023-11-15T22:43:42Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Modular Conformal Calibration [80.33410096908872]
回帰における再校正のためのアルゴリズムを多種多様なクラスで導入する。
このフレームワークは、任意の回帰モデルをキャリブレーションされた確率モデルに変換することを可能にする。
我々は17の回帰データセットに対するMCCの実証的研究を行った。
論文 参考訳(メタデータ) (2022-06-23T03:25:23Z) - Interpretable and Fair Boolean Rule Sets via Column Generation [18.08486863429421]
整数プログラムは、規則単純性のために最適に分類精度を交換するように定式化される。
公平性の設定を考慮し、分類パリティの2つの異なる尺度に関する明示的な制約を含むように定式化を拡張した。
他の公正かつ解釈可能な分類器と比較して、我々の手法は、公正性のより厳密な概念に適合する規則セットを精度の低いトレードオフで見つけることができる。
論文 参考訳(メタデータ) (2021-11-16T13:40:28Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese
Grammatical Error Correction [49.25830718574892]
本稿では,Tail-to-Tail (textbfTtT) という新しいフレームワークを提案する。
ほとんどのトークンが正しいので、ソースからターゲットに直接転送でき、エラー位置を推定して修正することができる。
標準データセット、特に可変長データセットに関する実験結果は、文レベルの精度、精度、リコール、F1-Measureの観点からTtTの有効性を示す。
論文 参考訳(メタデータ) (2021-06-03T05:56:57Z) - Retrain or not retrain: Conformal test martingales for change-point
detection [0.34635278365524663]
我々は,データの分布が変化するタイミングを検出するためのスキームを設定し,予測アルゴリズムを訓練する過程を補うことを主張する。
私たちの提案するスキームは、交換可能なマーチンゲール、すなわちデータの交換可能な分配の下でマーチンゲールであるプロセスに基づいています。
論文 参考訳(メタデータ) (2021-02-20T20:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。