論文の概要: Towards Faithful Multimodal Concept Bottleneck Models
- arxiv url: http://arxiv.org/abs/2603.13163v1
- Date: Fri, 13 Mar 2026 16:56:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:12.20224
- Title: Towards Faithful Multimodal Concept Bottleneck Models
- Title(参考訳): 忠実なマルチモーダル概念ボトルネックモデルに向けて
- Authors: Pierre Moreau, Emeline Pineau Ferrand, Yann Choho, Benjamin Wong, Annabelle Blangero, Milan Bhan,
- Abstract要約: 概念ボトルネックモデル(Concept Bottleneck Models、CBM)は、人間の解釈可能な概念の層を通して予測をルーティングする解釈可能なモデルである。
本稿では,概念検出と漏洩軽減を共同で狙う視覚言語バックボーン上に構築されたマルチモーダルCBMフレームワークであるf-CBMを紹介する。
実験により、f-CBMはタスク精度、概念検出、リーク低減の最良のトレードオフを実現することが示された。
- 参考スコア(独自算出の注目度): 0.07329200485567826
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concept Bottleneck Models (CBMs) are interpretable models that route predictions through a layer of human-interpretable concepts. While widely studied in vision and, more recently, in NLP, CBMs remain largely unexplored in multimodal settings. For their explanations to be faithful, CBMs must satisfy two conditions: concepts must be properly detected, and concept representations must encode only their intended semantics, without smuggling extraneous task-relevant or inter-concept information into final predictions, a phenomenon known as leakage. Existing approaches treat concept detection and leakage mitigation as separate problems, and typically improve one at the expense of predictive accuracy. In this work, we introduce f-CBM, a faithful multimodal CBM framework built on a vision-language backbone that jointly targets both aspects through two complementary strategies: a differentiable leakage loss to mitigate leakage, and a Kolmogorov-Arnold Network prediction head that provides sufficient expressiveness to improve concept detection. Experiments demonstrate that f-CBM achieves the best trade-off between task accuracy, concept detection, and leakage reduction, while applying seamlessly to both image and text or text-only datasets, making it versatile across modalities.
- Abstract(参考訳): 概念ボトルネックモデル(Concept Bottleneck Models、CBM)は、人間の解釈可能な概念の層を通して予測をルーティングする解釈可能なモデルである。
視覚や最近ではNLPで広く研究されているが、CBMはマルチモーダル環境ではほとんど探索されていない。
彼らの説明が忠実であるためには、CBMは2つの条件を満たす必要がある: 概念は適切に検出されなければならないし、概念表現は意図した意味論のみを符号化しなければならない。
既存のアプローチでは、概念検出と漏れ軽減を別の問題として扱い、予測精度を犠牲にして改善する。
本稿では,2つの相補的戦略により両側面を協調的に狙う視覚言語バックボーン上に構築された忠実なマルチモーダルCBMフレームワークであるf-CBMと,概念検出に十分な表現性を提供するコルモゴロフ・アルノルドネットワーク予測ヘッドを紹介する。
実験では、f-CBMは、画像とテキストとテキストのみのデータセットの両方にシームレスに適用し、タスクの正確性、概念検出、リーク削減の最良のトレードオフを実現する。
関連論文リスト
- Rethinking Concept Bottleneck Models: From Pitfalls to Solutions [53.84388497227224]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念の基底予測である。
CBM-Suiteはこれらの課題に対処するための方法論的なフレームワークである。
論文 参考訳(メタデータ) (2026-03-05T19:37:49Z) - Concepts' Information Bottleneck Models [9.435622803973898]
概念ボトルネックモデル(Concept Bottleneck Models、CBM)は、人間の理解可能な概念層を通じて決定をルーティングすることで解釈可能な予測を提供することを目的としている。
I(C;Y)$でタスク関連情報を保存しながら$I(X;C)$をペナライズする概念層上に、明示的なInformation Bottleneck正規化器を導入し、最小限のコンセプト表現を奨励する。
論文 参考訳(メタデータ) (2026-02-16T10:33:20Z) - Differential Vector Erasure: Unified Training-Free Concept Erasure for Flow Matching Models [49.10620605347065]
本研究では,フローマッチングモデルに特化して設計されたトレーニング不要な概念消去手法である差分ベクトル消去(DVE)を提案する。
我々の重要な洞察は、意味論的概念は生成フローを管理する速度場の方向構造に暗黙的に符号化されていることである。
推論中、DVEは速度場を微分方向に投影することで概念固有の成分を選択的に除去し、無関係な意味論に影響を与えることなく正確な概念抑圧を可能にする。
論文 参考訳(メタデータ) (2026-02-01T08:05:45Z) - Controllable Concept Bottleneck Models [55.03639763625018]
制御可能な概念ボトルネックモデル(CCBM)
CCBMは、概念ラベルレベル、概念レベル、データレベルという3つのモデル編集の粒度をサポートする。
CCBMは、数学的に厳密な閉形式近似を享受し、再訓練の必要性を和らげる影響関数から導かれる。
論文 参考訳(メタデータ) (2026-01-01T19:30:06Z) - Towards more holistic interpretability: A lightweight disentangled Concept Bottleneck Model [5.700536552863068]
概念ボトルネックモデル(CBM)は、人間の理解可能な概念を中間表現として予測することにより、解釈可能性を高める。
本稿では,視覚的特徴を意味論的に意味のある構成要素に自動的に分類する軽量なDECBMを提案する。
3つの多様なデータセットの実験により、LCDBMはより高い概念とクラス精度を達成し、解釈可能性と分類性能の両方において従来のCBMよりも優れていたことが示されている。
論文 参考訳(メタデータ) (2025-10-17T15:59:30Z) - Interpretable Few-Shot Image Classification via Prototypical Concept-Guided Mixture of LoRA Experts [79.18608192761512]
自己説明可能なモデル(SEM)は、視覚認識プロセスをより解釈可能なものにするために、プロトタイプ概念学習(PCL)に依存している。
パラメトリック不均衡と表現の不整合という2つの重要な課題を緩和するFew-Shotプロトタイプ概念分類フレームワークを提案する。
我々のアプローチは、既存のSEMを顕著な差で常に上回っており、5-way 5-shot分類では4.2%-8.7%の相対的な利得がある。
論文 参考訳(メタデータ) (2025-06-05T06:39:43Z) - Continuous Evolution Pool: Taming Recurring Concept Drift in Online Time Series Forecasting [58.448663215248565]
継続的進化プール(Continuous Evolution Pool, CEP)は、異なる概念の予測器のインスタンスを格納するプール機構である。
CEPは、様々な概念の知識を効果的に保持する。
オンライン予測と繰り返し概念のシナリオでは,CEPは予測結果を著しく向上させる。
論文 参考訳(メタデータ) (2025-05-28T03:27:49Z) - MulCPred: Learning Multi-modal Concepts for Explainable Pedestrian Action Prediction [57.483718822429346]
MulCPredは、トレーニングサンプルで表されるマルチモーダルな概念に基づいて、その予測を説明する。
MulCPredは複数のデータセットとタスクで評価される。
論文 参考訳(メタデータ) (2024-09-14T14:15:28Z) - Eliminating Information Leakage in Hard Concept Bottleneck Models with
Supervised, Hierarchical Concept Learning [17.982131928413096]
概念ボトルネックモデル(Concept Bottleneck Models、CBM)は、人間の理解できない概念で特徴やラベルをブリッジすることで、解釈可能で介入可能な予測を提供することを目的としている。
CBMは情報漏洩に悩まされ、概念以外の意図しない情報がその後のラベル予測にリークされる。
本稿では,CBMの新たなパラダイム,すなわちSupCBMを提案する。
論文 参考訳(メタデータ) (2024-02-03T03:50:58Z) - Auxiliary Losses for Learning Generalizable Concept-based Models [5.4066453042367435]
コンセプト・ボトルネック・モデル (Concept Bottleneck Models, CBM) は導入以来人気を集めている。
CBMは基本的に、モデルの潜在空間を人間に理解可能な高レベルな概念に制限する。
本稿では,協調型コンセプション・ボトルネックモデル(coop-CBM)を提案し,性能トレードオフを克服する。
論文 参考訳(メタデータ) (2023-11-18T15:50:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。