論文の概要: Debugging Concept Bottleneck Models through Removal and Retraining
- arxiv url: http://arxiv.org/abs/2509.21385v1
- Date: Tue, 23 Sep 2025 18:32:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:53.891994
- Title: Debugging Concept Bottleneck Models through Removal and Retraining
- Title(参考訳): 除去・再訓練によるデバッギング概念ボトルネックモデル
- Authors: Eric Enouen, Sainyam Galhotra,
- Abstract要約: 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の解釈可能な概念のセットを用いて最終タスクラベルを予測する。
これらの介入は、CBMと専門家の推論の体系的な不一致に対処することができない。
本稿では,CBMの2段階の除去・再訓練プロセスに追従する一般的な解釈可能なフレームワークを提案する。
- 参考スコア(独自算出の注目度): 11.162969587770094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concept Bottleneck Models (CBMs) use a set of human-interpretable concepts to predict the final task label, enabling domain experts to not only validate the CBM's predictions, but also intervene on incorrect concepts at test time. However, these interventions fail to address systemic misalignment between the CBM and the expert's reasoning, such as when the model learns shortcuts from biased data. To address this, we present a general interpretable debugging framework for CBMs that follows a two-step process of Removal and Retraining. In the Removal step, experts use concept explanations to identify and remove any undesired concepts. In the Retraining step, we introduce CBDebug, a novel method that leverages the interpretability of CBMs as a bridge for converting concept-level user feedback into sample-level auxiliary labels. These labels are then used to apply supervised bias mitigation and targeted augmentation, reducing the model's reliance on undesired concepts. We evaluate our framework with both real and automated expert feedback, and find that CBDebug significantly outperforms prior retraining methods across multiple CBM architectures (PIP-Net, Post-hoc CBM) and benchmarks with known spurious correlations.
- Abstract(参考訳): 概念ボトルネックモデル(CBM)は、最終タスクラベルを予測するために人間解釈可能な概念のセットを使用し、ドメインの専門家がCBMの予測を検証するだけでなく、テスト時に誤った概念に介入することを可能にする。
しかしながら、これらの介入は、モデルがバイアスデータからショートカットを学習するなど、CBMと専門家の推論の体系的な不一致に対処することができない。
そこで本研究では,CBMの2段階の除去・再学習プロセスに追従する汎用的なデバッグフレームワークを提案する。
除去ステップでは、専門家は望ましくない概念を特定し削除するために概念の説明を使用する。
CBDebugは,概念レベルのユーザフィードバックをサンプルレベルの補助ラベルに変換するブリッジとして,CBMの解釈可能性を活用する新しい手法である。
これらのラベルは、教師付きバイアス緩和と対象拡大の適用に使用され、望ましくない概念へのモデルの依存を減らす。
CBDebugは,複数のCBMアーキテクチャ (PIP-Net, Post-hoc CBM) および既知のスプリアス相関を持つベンチマークにおいて,事前のトレーニング手法よりも優れていた。
関連論文リスト
- Interpretable Reward Modeling with Active Concept Bottlenecks [54.00085739303773]
本稿では,解釈可能な嗜好学習を可能にする報酬モデリングフレームワークであるConcept Bottleneck Reward Models (CB-RM)を紹介する。
不透明報酬関数に依存する標準的なRLHF法とは異なり、CB-RMは報酬予測を人間の解釈可能な概念に分解する。
我々は,最も情報性の高い概念ラベルを動的に取得する能動的学習戦略を定式化する。
論文 参考訳(メタデータ) (2025-07-07T06:26:04Z) - Interpretable Few-Shot Image Classification via Prototypical Concept-Guided Mixture of LoRA Experts [79.18608192761512]
自己説明可能なモデル(SEM)は、視覚認識プロセスをより解釈可能なものにするために、プロトタイプ概念学習(PCL)に依存している。
パラメトリック不均衡と表現の不整合という2つの重要な課題を緩和するFew-Shotプロトタイプ概念分類フレームワークを提案する。
我々のアプローチは、既存のSEMを顕著な差で常に上回っており、5-way 5-shot分類では4.2%-8.7%の相対的な利得がある。
論文 参考訳(メタデータ) (2025-06-05T06:39:43Z) - Adaptive Test-Time Intervention for Concept Bottleneck Models [6.31833744906105]
概念ボトルネックモデル(CBM)は、人間レベルの「概念」を予測することによってモデルの解釈可能性を改善することを目的としている
我々は,2成分蒸留(BD)を得るためにFIGS(Fast Interpretable Greedy Sum-Trees)を提案する。
FIGS-BDは、CBMのバイナリ拡張されたコンセプト・トゥ・ターゲット部分を解釈可能なツリーベースモデルに蒸留する。
論文 参考訳(メタデータ) (2025-03-09T19:03:48Z) - Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - Editable Concept Bottleneck Models [36.38845338945026]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解できない概念層を通じて予測プロセスを解明する能力に対して、多くの注目を集めている。
多くのシナリオでは、プライバシの懸念などの理由から、トレーニングデータや新しい概念をトレーニングされたCBMから削除/挿入する必要があります。
我々は、スクラッチから再学習することなく効率的なCBMを導出するための編集可能な概念ボトルネックモデル(ECBMs)を提案する。
論文 参考訳(メタデータ) (2024-05-24T11:55:46Z) - Towards Motion Forecasting with Real-World Perception Inputs: Are
End-to-End Approaches Competitive? [93.10694819127608]
実世界の知覚入力を用いた予測手法の統一評価パイプラインを提案する。
我々の詳細な調査では、キュレートされたデータから知覚ベースのデータへ移行する際の大きなパフォーマンスギャップが明らかになりました。
論文 参考訳(メタデータ) (2023-06-15T17:03:14Z) - Post-hoc Concept Bottleneck Models [11.358495577593441]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、入力を解釈可能な概念のセットにマッピングし、その概念を用いて予測を行う。
CBMは、ボトルネックを学ぶためにトレーニングデータに概念ラベルを必要とするため、実際には制限があり、強い事前訓練されたモデルを活用しない。
解釈可能性の利点を保ちながら、モデル性能を犠牲にすることなく、任意のニューラルネットワークをPCBMに変換することができることを示す。
論文 参考訳(メタデータ) (2022-05-31T00:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。