論文の概要: PatClArC: Using Pattern Concept Activation Vectors for Noise-Robust
Model Debugging
- arxiv url: http://arxiv.org/abs/2202.03482v1
- Date: Mon, 7 Feb 2022 19:40:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-09 13:51:08.883109
- Title: PatClArC: Using Pattern Concept Activation Vectors for Noise-Robust
Model Debugging
- Title(参考訳): patclarc: ノイズロバストモデルデバッグにパターン概念活性化ベクトルを使用する
- Authors: Frederik Pahde, Leander Weber, Christopher J. Anders, Wojciech Samek,
Sebastian Lapuschkin
- Abstract要約: 最先端の機械学習モデルは通常、大規模なベンチマークデータセット上で(事前)トレーニングされている。
これらはしばしば、データ収集プロセスで気付かれていないバイアス、アーティファクト、エラーを含んでいる。
遅延空間におけるノイズロスの概念表現のためのパターン概念活性化ベクトル(PCAV)を提案する。
- 参考スコア(独自算出の注目度): 11.647248964444353
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art machine learning models are commonly (pre-)trained on large
benchmark datasets. These often contain biases, artifacts, or errors that have
remained unnoticed in the data collection process and therefore fail in
representing the real world truthfully. This can cause models trained on these
datasets to learn undesired behavior based upon spurious correlations, e.g.,
the existence of a copyright tag in an image. Concept Activation Vectors (CAV)
have been proposed as a tool to model known concepts in latent space and have
been used for concept sensitivity testing and model correction. Specifically,
class artifact compensation (ClArC) corrects models using CAVs to represent
data artifacts in feature space linearly. Modeling CAVs with filters of linear
models, however, causes a significant influence of the noise portion within the
data, as recent work proposes the unsuitability of linear model filters to find
the signal direction in the input, which can be avoided by instead using
patterns. In this paper we propose Pattern Concept Activation Vectors (PCAV)
for noise-robust concept representations in latent space. We demonstrate that
pattern-based artifact modeling has beneficial effects on the application of
CAVs as a means to remove influence of confounding features from models via the
ClArC framework.
- Abstract(参考訳): 最先端の機械学習モデルは、大規模なベンチマークデータセットで一般的に(事前)トレーニングされる。
これらはしばしば、データ収集プロセスに気付かれていないバイアス、アーティファクト、エラーを含んでいるため、現実の世界を真実に表現できない。
これにより、これらのデータセットでトレーニングされたモデルは、例えば画像に著作権タグが存在するなど、刺激的な相関に基づいて、望ましくない振る舞いを学ぶことができる。
概念活性化ベクトル(cav)は、既知の概念を潜在空間でモデル化するためのツールとして提案されており、概念の感度テストやモデル修正に使われている。
特にクラスアーティファクト補償(clarc)はcavsを使ってデータアーティファクトを線形に表現するモデルを修正する。
しかし、線形モデルのフィルタを用いたキャビネットのモデル化は、データ内のノイズ部分に大きな影響を与え、最近の研究は、入力の信号方向を見つけるために線形モデルフィルタの不適合性を提案している。
本稿では,潜在空間における雑音・ロバスト概念表現のためのパターン概念活性化ベクトル(pcav)を提案する。
パターンベースアーティファクトモデリングは、ClArCフレームワークを介してモデルからコンバウンディング特徴の影響を取り除く手段として、CAVの適用に有益であることを示す。
関連論文リスト
- Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - Improving the Explain-Any-Concept by Introducing Nonlinearity to the Trainable Surrogate Model [4.6040036610482655]
EAC(Explain Any Concept)モデルは、意思決定を説明するフレキシブルな方法です。
EACモデルは、ターゲットモデルをシミュレートする訓練可能な1つの線形層を持つ代理モデルを用いている。
元のサロゲートモデルに追加の非線形層を導入することで、ERCモデルの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-05-20T07:25:09Z) - Improving Intervention Efficacy via Concept Realignment in Concept Bottleneck Models [57.86303579812877]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念に基づいて、解釈可能なモデル決定を可能にする画像分類である。
既存のアプローチは、強いパフォーマンスを達成するために、画像ごとに多数の人間の介入を必要とすることが多い。
本稿では,概念関係を利用した学習型概念認識介入モジュールについて紹介する。
論文 参考訳(メタデータ) (2024-05-02T17:59:01Z) - Understanding the (Extra-)Ordinary: Validating Deep Model Decisions with Prototypical Concept-based Explanations [13.60538902487872]
本稿では, 実例的(地域的)かつクラス的(グローバル的)な意思決定戦略をプロトタイプを通じて伝達する, ポストホックなコンセプトベースXAIフレームワークを提案する。
我々は,3つのデータセットにまたがるアウト・オブ・ディストリビューション・サンプル,突発的なモデル行動,データ品質問題同定におけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-11-28T10:53:26Z) - Identifying Linear Relational Concepts in Large Language Models [16.917379272022064]
トランスフォーマー言語モデル(LM)は、隠れたアクティベーションの潜在空間における方向として概念を表現することが示されている。
本稿では,リレーショナル・リレーショナル・コンセプト (LRC) と呼ばれる手法を提案する。
論文 参考訳(メタデータ) (2023-11-15T14:01:41Z) - Learning Transferable Conceptual Prototypes for Interpretable
Unsupervised Domain Adaptation [79.22678026708134]
本稿では,Transferable Prototype Learning (TCPL) という,本質的に解釈可能な手法を提案する。
この目的を達成するために、ソースドメインからターゲットドメインにカテゴリの基本概念を転送する階層的なプロトタイプモジュールを設計し、基礎となる推論プロセスを説明するためにドメイン共有プロトタイプを学習する。
総合的な実験により,提案手法は有効かつ直感的な説明を提供するだけでなく,従来の最先端技術よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-10-12T06:36:41Z) - Concept Gradient: Concept-based Interpretation Without Linear Assumption [77.96338722483226]
概念活性化ベクトル(Concept Activation Vector, CAV)は、与えられたモデルと概念の潜在表現の間の線形関係を学習することに依存する。
我々は、線形概念関数を超えて概念に基づく解釈を拡張する概念グラディエント(CG)を提案した。
我々は、CGがおもちゃの例と実世界のデータセットの両方でCAVより優れていることを実証した。
論文 参考訳(メタデータ) (2022-08-31T17:06:46Z) - Exploring Concept Contribution Spatially: Hidden Layer Interpretation
with Spatial Activation Concept Vector [5.873416857161077]
コンセプトアクティベーションベクトル(TCAV)を使用したテストは、クエリ概念のターゲットクラスへのコントリビューションを定量化する強力なツールを提供する。
対象物が領域のごく一部しか占有していない画像の場合、TCAV評価は冗長な背景特徴によって妨害される可能性がある。
論文 参考訳(メタデータ) (2022-05-21T15:58:57Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z) - Invertible Concept-based Explanations for CNN Models with Non-negative
Concept Activation Vectors [24.581839689833572]
コンピュータビジョンのための畳み込みニューラルネットワーク(CNN)モデルは強力だが、最も基本的な形式では説明不可能である。
近似線形モデルの特徴的重要性による最近の説明に関する研究は、入力レベル特徴から概念活性化ベクトル(CAV)の形で中間層特徴写像から特徴へと移行した。
本稿では,Ghorbani etal.のACEアルゴリズムを再考し,その欠点を克服するために,別の非可逆的概念ベース説明(ICE)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-27T17:57:26Z) - MetaSDF: Meta-learning Signed Distance Functions [85.81290552559817]
ニューラルな暗示表現で形状を一般化することは、各関数空間上の学習先行値に比例する。
形状空間の学習をメタラーニング問題として定式化し、勾配に基づくメタラーニングアルゴリズムを利用してこの課題を解決する。
論文 参考訳(メタデータ) (2020-06-17T05:14:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。