論文の概要: DeMix: Debugging Training Data with Mixed Data Error Types by Investigating Influence Vectors
- arxiv url: http://arxiv.org/abs/2606.11616v2
- Date: Tue, 16 Jun 2026 04:07:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.528746
- Title: DeMix: Debugging Training Data with Mixed Data Error Types by Investigating Influence Vectors
- Title(参考訳): DeMix: 影響ベクトルの調査による混合データエラータイプによるトレーニングデータのデバッグ
- Authors: Jiale Deng, Yanyan Shen, Xiaogang Shi, Junjun Chai,
- Abstract要約: 誤サンプルとそのエラータイプを同時に診断するフレームワークであるDeMixを提案する。
私たちのキーとなる洞察は、異なるエラータイプがモデルの振る舞いに異なるパターンを生み出すということです。
DeMixは、各トレーニングサンプルがモデル予測にどのように影響するかを特徴付ける影響ベクトルによって、そのようなエラー固有のパターンをキャプチャする。
- 参考スコア(独自算出の注目度): 19.92759537828626
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: High-quality training data is essential for the success of machine learning models. However, real-world datasets often contain mixed types of errors arising from systematic flaws in data preparation pipelines, including label errors, feature errors, and spurious correlations. Effective debugging of training data requires both detecting erroneous samples and identifying their specific error types to enable targeted repair, yet existing data cleaning and attribution methods fail to adequately address this dual requirement. In this paper, we propose DeMix, a novel framework that simultaneously diagnoses erroneous samples and their error types. Our key insight is that different error types produce distinct patterns on model behavior. DeMix captures such error-specific patterns by influence vectors that characterize how each training sample affects model predictions across all validation samples. We formulate training data debugging as a multi-label classification problem where a classifier is developed to predict error types directly from influence vectors. We further introduce an intervention-based learning strategy that guides the classifier to capture invariant rationales specific to each error type, ensuring the learned classifier generalizes effectively. Empirical evaluations on 11 tasks across tabular data prediction, recommendation systems, and LLM alignment demonstrate that DeMix significantly outperforms state-of-the-art approaches, achieving a 22.61% improvement in data debugging F1-score and a 9.32% gain in task model performance after data repair. Code is available at: https://github.com/SJTU-DMTai/DeMix.
- Abstract(参考訳): 機械学習モデルの成功には、高品質なトレーニングデータが不可欠である。
しかし、実世界のデータセットには、ラベルエラー、機能エラー、刺激的な相関を含む、データ準備パイプラインの系統的な欠陥から生じる様々な種類のエラーが含まれていることが多い。
トレーニングデータの効果的なデバッグには、誤ったサンプルの検出と、ターゲットとする修復を可能にするための特定のエラータイプの識別の両方が必要であるが、既存のデータクリーニングと属性メソッドは、この2つの要件に適切に対処することができない。
本稿では,誤サンプルとそのエラータイプを同時に診断する新しいフレームワークであるDeMixを提案する。
私たちのキーとなる洞察は、異なるエラータイプがモデルの振る舞いに異なるパターンを生み出すということです。
DeMixは、各トレーニングサンプルがバリデーションサンプル全体にわたってモデル予測にどのように影響するかを特徴付ける影響ベクトルによって、このようなエラー固有のパターンをキャプチャする。
学習データデバッギングを多ラベル分類問題として定式化し, 影響ベクトルから直接エラータイプを予測する分類器を開発した。
さらに、介入に基づく学習戦略を導入し、各エラータイプ固有の不変な論理を抽出し、学習された分類器が効果的に一般化することを保証する。
表形式のデータ予測、レコメンデーションシステム、LCMアライメントを含む11のタスクに対する実証的な評価は、DeMixが最先端のアプローチを著しく上回り、データデバッグのF1スコアが22.61%向上し、データ修復後のタスクモデルのパフォーマンスが9.32%向上したことを示している。
コードは、https://github.com/SJTU-DM Tai/DeMix.comで入手できる。
関連論文リスト
- Subtle Errors in Reasoning: Preference Learning via Error-injected Self-editing [59.405145971637204]
eRror-Injected Self-Editing (RISE) と呼ばれる新しい好み学習フレームワークを提案する。
RISEは、事前定義された微妙なエラーをピボットトークンに注入する。
RISEの有効性を検証する実験では、Qwen2-7B-Instructでの優先学習により、GSM8Kでは3.0%、MATHでは7.9%が顕著に改善され、トレーニングサンプルは4.5Kに留まった。
論文 参考訳(メタデータ) (2024-10-09T07:43:38Z) - Parameter-tuning-free data entry error unlearning with adaptive
selective synaptic dampening [51.34904967046097]
本稿では,パラメータチューニングの必要性を排除した選択的シナプス減衰アンラーニング法の拡張を提案する。
本稿では,ResNet18とVision Transformerの未学習タスクにおける適応選択的シナプス減衰(ASSD)の性能を示す。
このアプローチの適用は、サプライチェーン管理などの産業環境において特に魅力的である。
論文 参考訳(メタデータ) (2024-02-06T14:04:31Z) - Information FOMO: The unhealthy fear of missing out on information. A method for removing misleading data for healthier models [0.0]
ミスリーディングや不要なデータは、マシンラーニング(ML)モデルの健全性や正確性に大きく影響します。
本稿では,データセット内の重要な情報を特定するシーケンシャルな選択法を提案する。
これらの不安定性は、基礎となるマップの複雑さの結果であり、極端な事象や重い尾と結びついている。
論文 参考訳(メタデータ) (2022-08-27T19:43:53Z) - Understanding Factual Errors in Summarization: Errors, Summarizers,
Datasets, Error Detectors [105.12462629663757]
本研究では、既存の9つのデータセットから事実性エラーアノテーションを集約し、基礎となる要約モデルに従ってそれらを階層化する。
本稿では,この階層化ベンチマークにおいて,最近のChatGPTベースの指標を含む最先端の事実性指標の性能を比較し,その性能が様々な種類の要約モデルで大きく異なることを示す。
論文 参考訳(メタデータ) (2022-05-25T15:26:48Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Self Training with Ensemble of Teacher Models [8.257085583227695]
堅牢なディープラーニングモデルのトレーニングには,大量のラベル付きデータが必要である。
このようなラベル付きデータの大規模なリポジトリがなければ、ラベルなしのデータも同様に利用することができる。
準スーパービジョン学習は、そのようなラベルのないデータを分類モデルの訓練に活用することを目的としている。
論文 参考訳(メタデータ) (2021-07-17T09:44:09Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Defuse: Harnessing Unrestricted Adversarial Examples for Debugging
Models Beyond Test Accuracy [11.265020351747916]
Defuseは、テストデータ以外のモデルエラーを自動的に検出し、修正する手法である。
本稿では, 生成モデルを用いて, モデルによって誤分類された自然発生事例を探索する逆機械学習手法に着想を得たアルゴリズムを提案する。
Defuseはテストセットの一般化を維持しながら、微調整後のエラーを修正する。
論文 参考訳(メタデータ) (2021-02-11T18:08:42Z) - Oversampling Adversarial Network for Class-Imbalanced Fault Diagnosis [12.526197448825968]
クラス不均衡問題は、データをタイムリーに予測し分類できる堅牢な学習システムを必要とする。
本稿では,同時分類と故障検出のための新しい対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-07T10:12:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。