論文の概要: Discovering Fine-Grained Visual-Concept Relations by Disentangled Optimal Transport Concept Bottleneck Models
- arxiv url: http://arxiv.org/abs/2505.07209v1
- Date: Mon, 12 May 2025 03:31:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.253688
- Title: Discovering Fine-Grained Visual-Concept Relations by Disentangled Optimal Transport Concept Bottleneck Models
- Title(参考訳): 直交最適輸送概念ボトルネックモデルによる細粒度視覚概念関係の発見
- Authors: Yan Xie, Zequn Zeng, Hao Zhang, Yucheng Ding, Yi Wang, Zhengjue Wang, Bo Chen, Hongwei Liu,
- Abstract要約: 概念ボトルネックモデル(CBM)は、入力画像と出力予測の間の中間概念空間を探索することにより、意思決定プロセスを透過化しようとする。
既存のCBMは、画像全体と概念の間の粗い粒度の関係を学習するだけで、局所的な画像情報を考慮しない。
本稿では,局所的なイメージパッチと概念間の微粒な視覚概念関係を探索するDistangled Optimal Transport CBMフレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.617257464664572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concept Bottleneck Models (CBMs) try to make the decision-making process transparent by exploring an intermediate concept space between the input image and the output prediction. Existing CBMs just learn coarse-grained relations between the whole image and the concepts, less considering local image information, leading to two main drawbacks: i) they often produce spurious visual-concept relations, hence decreasing model reliability; and ii) though CBMs could explain the importance of every concept to the final prediction, it is still challenging to tell which visual region produces the prediction. To solve these problems, this paper proposes a Disentangled Optimal Transport CBM (DOT-CBM) framework to explore fine-grained visual-concept relations between local image patches and concepts. Specifically, we model the concept prediction process as a transportation problem between the patches and concepts, thereby achieving explicit fine-grained feature alignment. We also incorporate orthogonal projection losses within the modality to enhance local feature disentanglement. To further address the shortcut issues caused by statistical biases in the data, we utilize the visual saliency map and concept label statistics as transportation priors. Thus, DOT-CBM can visualize inversion heatmaps, provide more reliable concept predictions, and produce more accurate class predictions. Comprehensive experiments demonstrate that our proposed DOT-CBM achieves SOTA performance on several tasks, including image classification, local part detection and out-of-distribution generalization.
- Abstract(参考訳): 概念ボトルネックモデル(CBM)は、入力画像と出力予測の間の中間概念空間を探索することにより、意思決定プロセスを透過化しようとする。
既存のCBMは、画像全体と概念の間の粗い粒度の関係を学習するだけで、局所的な画像情報はあまり考慮しない。
一 しばしば急激な視覚概念関係を生み出し、したがってモデルの信頼性を低下させる。
二 CBMは、最終予測にすべての概念の重要性を説明することができるが、どの視覚領域が予測を生成するかを知ることは依然として困難である。
そこで本研究では,局所的なイメージパッチと概念間の微粒な視覚概念関係を探索するために,Distangled Optimal Transport CBM (DOT-CBM) フレームワークを提案する。
具体的には,概念予測過程をパッチと概念間の輸送問題としてモデル化し,よりきめ細かな特徴アライメントを実現する。
また,局所的特徴のゆがみを高めるために,直交射影損失をモダリティに組み込んだ。
データの統計的バイアスによるショートカット問題にさらに対処するために、視覚的サリエンシマップと概念ラベル統計を輸送先として活用する。
したがって、DOT-CBMは逆ヒートマップを可視化し、より信頼性の高い概念予測を提供し、より正確なクラス予測を生成することができる。
総合的な実験により,提案したDOT-CBMは,画像分類,局所部分検出,分布外一般化など,複数のタスクにおいてSOTA性能を実現することが示された。
関連論文リスト
- DCBM: Data-Efficient Visual Concept Bottleneck Models [13.36057999450821]
概念ボトルネックモデル(CBM)は、人間の理解可能な概念をベースとした予測によって、ニューラルネットワークの解釈可能性を高める。
我々は,解釈可能性を維持しつつ,概念生成時の大規模なサンプルサイズの必要性を低減できるデータ効率のCBMを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:04:58Z) - MulCPred: Learning Multi-modal Concepts for Explainable Pedestrian Action Prediction [57.483718822429346]
MulCPredは、トレーニングサンプルで表されるマルチモーダルな概念に基づいて、その予測を説明する。
MulCPredは複数のデータセットとタスクで評価される。
論文 参考訳(メタデータ) (2024-09-14T14:15:28Z) - Improving Intervention Efficacy via Concept Realignment in Concept Bottleneck Models [57.86303579812877]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念に基づいて、解釈可能なモデル決定を可能にする画像分類である。
既存のアプローチは、強いパフォーマンスを達成するために、画像ごとに多数の人間の介入を必要とすることが多い。
本稿では,概念関係を利用した学習型概念認識介入モジュールについて紹介する。
論文 参考訳(メタデータ) (2024-05-02T17:59:01Z) - On the Concept Trustworthiness in Concept Bottleneck Models [39.928868605678744]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、推論プロセスを、概念マッピングと概念ラベル予測に分解する。
概念からラベルへの予測の透明性にもかかわらず、入力から中間概念へのマッピングはブラックボックスのままである。
概念が関連する領域から導出されているかどうかを評価するために、概念信頼性スコアと呼ばれる先駆的な指標が提案されている。
拡張されたCBMを導入し、特徴マップの異なる部分から概念予測を具体的に行えるようにした。
論文 参考訳(メタデータ) (2024-03-21T12:24:53Z) - Auxiliary Losses for Learning Generalizable Concept-based Models [5.4066453042367435]
コンセプト・ボトルネック・モデル (Concept Bottleneck Models, CBM) は導入以来人気を集めている。
CBMは基本的に、モデルの潜在空間を人間に理解可能な高レベルな概念に制限する。
本稿では,協調型コンセプション・ボトルネックモデル(coop-CBM)を提案し,性能トレードオフを克服する。
論文 参考訳(メタデータ) (2023-11-18T15:50:07Z) - Explainable fetal ultrasound quality assessment with progressive concept bottleneck models [6.734637459963132]
胎児超音波品質評価のための総合的,説明可能な方法を提案する。
タスクに「可読性の概念」を導入し、シーケンシャルな専門家による意思決定プロセスを模倣する。
実験により、我々のモデルは、社内データセット上で同等のコンセプトフリーモデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-11-19T09:31:19Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。