Fugu-MT 論文翻訳(概要): When are Post-hoc Conceptual Explanations Identifiable?

論文の概要: When are Post-hoc Conceptual Explanations Identifiable?

arxiv url: http://arxiv.org/abs/2206.13872v5
Date: Tue, 6 Jun 2023 07:01:53 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-07 23:53:00.530960
Title: When are Post-hoc Conceptual Explanations Identifiable?
Title（参考訳）: ポストホック概念記述はいつ可能か?
Authors: Tobias Leemann, Michael Kirchhof, Yao Rong, Enkelejda Kasneci, Gjergji Kasneci
Abstract要約: 人間の概念ラベルが利用できない場合、概念発見手法は解釈可能な概念のための訓練された埋め込み空間を探索する。我々は、概念発見は特定可能であり、多くの既知の概念を確実に回収し、説明の信頼性を保証するべきであると論じている。本結果は,人間ラベルのない信頼性の高い概念発見を保証できる厳密な条件を強調した。
参考スコア（独自算出の注目度）: 18.85180188353977
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Interest in understanding and factorizing learned embedding spaces through conceptual explanations is steadily growing. When no human concept labels are available, concept discovery methods search trained embedding spaces for interpretable concepts like object shape or color that can provide post-hoc explanations for decisions. Unlike previous work, we argue that concept discovery should be identifiable, meaning that a number of known concepts can be provably recovered to guarantee reliability of the explanations. As a starting point, we explicitly make the connection between concept discovery and classical methods like Principal Component Analysis and Independent Component Analysis by showing that they can recover independent concepts under non-Gaussian distributions. For dependent concepts, we propose two novel approaches that exploit functional compositionality properties of image-generating processes. Our provably identifiable concept discovery methods substantially outperform competitors on a battery of experiments including hundreds of trained models and dependent concepts, where they exhibit up to 29 % better alignment with the ground truth. Our results highlight the strict conditions under which reliable concept discovery without human labels can be guaranteed and provide a formal foundation for the domain. Our code is available online.
Abstract（参考訳）: 概念的説明による学習された埋め込み空間の理解と分解への関心は着実に伸びている。人間のコンセプトラベルが利用できない場合、概念発見手法は、オブジェクトの形や色などの解釈可能な概念のための訓練された埋め込み空間を探索し、決定のためのポストホックな説明を提供する。従来の研究とは異なり、概念発見は特定可能であるべきであり、多くの既知の概念を証明して説明の信頼性を保証することができる。出発点として,非ガウス分布下で独立概念を回復できることを示すことにより,概念発見と主成分分析や独立成分分析のような古典的手法との関係を明確にする。本稿では,画像生成過程の関数的構成性を利用した2つの新しい手法を提案する。私たちの実証可能な概念発見手法は、何百もの訓練されたモデルや依存する概念を含む実験のバッテリーでライバルより大幅に優れています。本研究は,人間のラベルのない信頼できる概念発見が保証され,そのドメインの正式な基盤となる厳格な条件を浮き彫りにする。私たちのコードはオンラインで入手できる。

関連論文リスト

Dialectics for Artificial Intelligence [24.816514958011442]
人工知能は生の経験から、人間の監督なしに、人間が発見した概念を発見できるのか? ひとつの課題は、調査が進むにつれて、概念境界がシフトし、分割し、統合できることです。本稿では,エージェントの全体体験と構造的関係からのみ定義された情報オブジェクトとして概念を扱うアルゴリズム情報視点を提案する。
論文参考訳（メタデータ） (2025-12-19T09:17:21Z)
A Geometric Unification of Concept Learning with Concept Cones [58.70836885177496]
解釈可能性の2つの伝統は、並べて進化してきたが、互いに話すことはめったにない:概念ボトルネックモデル(CBM)とスパースオートエンコーダ(SAE)。両パラダイムが同じ幾何学的構造をインスタンス化することを示す。 CBMは人間の定義した参照ジオメトリを提供するが、SAEは学習した円錐がCBMをどの程度よく近似するか、あるいは包含しているかによって評価することができる。
論文参考訳（メタデータ） (2025-12-08T09:51:46Z)
FaCT: Faithful Concept Traces for Explaining Neural Network Decisions [56.796533084868884]
ディープネットワークは、幅広いタスクで顕著なパフォーマンスを示しているが、それらの機能に関するグローバルな概念レベルの理解は、依然として重要な課題である。本稿では,概念に基づく説明の忠実さを強調し,モデル独立な機械的概念説明を用いた新しいモデルを提案する。私たちの概念はクラス間で共有され、あらゆるレイヤから、ロジットへの貢献と入力-視覚化を忠実にトレースすることができます。
論文参考訳（メタデータ） (2025-10-29T13:35:46Z)
Nonparametric Identification of Latent Concepts [17.996329262929113]
人間の学習の基本である比較の認知メカニズムは、マシンがデータの基礎となる真の概念を回復する上でも不可欠である、と我々は主張する。具体的には、複数の観察クラスを持つ概念の識別可能性に関する理論的枠組みを開発することを目的とする。クラス間で十分な多様性があれば、特定の概念型を仮定せずに隠れた概念を識別できることが示される。
論文参考訳（メタデータ） (2025-09-30T18:13:53Z)
Enhancing the Comprehensibility of Text Explanations via Unsupervised Concept Discovery [21.58887931556088]
ECO-Conceptは、概念アノテーションなしで理解可能な概念を発見するための、本質的に解釈可能なフレームワークである。本手法は多種多様なタスクにまたがって優れた性能を実現する。さらなる概念評価は、ECO-Conceptが学んだ概念が理解度において現在の概念を上回っていることを検証する。
論文参考訳（メタデータ） (2025-05-26T17:59:51Z)
OmniPrism: Learning Disentangled Visual Concept for Image Generation [57.21097864811521]
創造的な視覚概念の生成は、しばしば関連する結果を生み出すために参照イメージ内の特定の概念からインスピレーションを引き出す。我々は,創造的画像生成のための視覚的概念分離手法であるOmniPrismを提案する。提案手法は,自然言語で案内される不整合概念表現を学習し,これらの概念を組み込むために拡散モデルを訓練する。
論文参考訳（メタデータ） (2024-12-16T18:59:52Z)
Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文参考訳（メタデータ） (2024-07-19T17:50:11Z)
How to Blend Concepts in Diffusion Models [48.68800153838679]
近年の手法は複数の潜在表現とその関連性を利用しており、この研究はさらに絡み合っている。我々のゴールは、潜在空間における操作が根底にある概念にどのように影響するかを理解することです。我々の結論は、宇宙操作によるブレンドの概念は可能であるが、最良の戦略はブレンドの文脈に依存する。
論文参考訳（メタデータ） (2024-07-19T13:05:57Z)
Explaining Explainability: Understanding Concept Activation Vectors [35.37586279472797]
最近の解釈可能性法では、概念に基づく説明を用いて、ディープラーニングモデルの内部表現を、人間が慣れ親しんだ言語に翻訳する。これは、ニューラルネットワークの表現空間にどの概念が存在するかを理解する必要がある。本研究では,概念活性化ベクトル(Concept Activation Vectors, CAV)の3つの特性について検討する。本研究では,これらの特性の存在を検出するためのツールを導入し,それらが引き起こした説明にどのように影響するかを把握し,その影響を最小限に抑えるための推奨事項を提供する。
論文参考訳（メタデータ） (2024-04-04T17:46:20Z)
Estimation of Concept Explanations Should be Uncertainty Aware [39.598213804572396]
概念説明(Concept Explanations)と呼ばれる特定の概念について研究し、人間の理解可能な概念を用いてモデルを解釈することを目的としている。簡単な解釈で人気があるが、概念的な説明は騒々しいことが知られている。本稿では,これらの問題に対処する不確実性を考慮したベイズ推定手法を提案する。
論文参考訳（メタデータ） (2023-12-13T11:17:27Z)
Implicit Concept Removal of Diffusion Models [92.55152501707995]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文参考訳（メタデータ） (2023-10-09T17:13:10Z)
A Geometric Notion of Causal Probing [85.49839090913515]
線形部分空間仮説は、言語モデルの表現空間において、動詞数のような概念に関するすべての情報が線形部分空間に符号化されていることを述べる。理想線型概念部分空間を特徴づける内在的基準のセットを与える。 2つの言語モデルにまたがる少なくとも1つの概念に対して、この概念のサブスペースは、生成された単語の概念値を精度良く操作することができる。
論文参考訳（メタデータ） (2023-07-27T17:57:57Z)
The Hidden Language of Diffusion Models [70.03691458189604]
本稿では,テキスト概念の内部表現を拡散モデルで解釈する新しい手法であるConceptorを提案する。概念間の驚くべき視覚的つながりは、それらのテキスト意味論を超越している。我々はまた、模範的、偏見、名高い芸術様式、あるいは複数の意味の同時融合に依存する概念も発見する。
論文参考訳（メタデータ） (2023-06-01T17:57:08Z)
COPEN: Probing Conceptual Knowledge in Pre-trained Language Models [60.10147136876669]
概念的知識は人間の認知と知識基盤の基本である。既存の知識探索作業は、事前訓練された言語モデル(PLM)の事実知識のみに焦点を当て、概念知識を無視する。 PLMが概念的類似性によってエンティティを編成し、概念的特性を学習し、コンテキスト内でエンティティを概念化するかどうかを調査する3つのタスクを設計する。タスクのために、393のコンセプトをカバーする24kのデータインスタンスを収集、注釈付けします。
論文参考訳（メタデータ） (2022-11-08T08:18:06Z)
Concept Activation Regions: A Generalized Framework For Concept-Based Explanations [95.94432031144716]
既存の手法では、概念を説明する例は、ディープニューラルネットワークの潜伏空間の一定の方向にマッピングされていると仮定している。そこで本研究では,DNNの潜在空間において,異なるクラスタに分散した概念例を提案する。この概念活性化領域(CAR)は、グローバルな概念に基づく説明と局所的な概念に基づく特徴の重要性をもたらす。
論文参考訳（メタデータ） (2022-09-22T17:59:03Z)
Overlooked factors in concept-based explanations: Dataset choice, concept learnability, and human capability [25.545486537295144]
概念に基づく解釈可能性法は、事前に定義されたセマンティック概念のセットを使用して、ディープニューラルネットワークモデル予測を説明することを目的としている。その人気にもかかわらず、文学によって十分に理解され、明瞭化されていない限界に悩まされている。概念に基づく説明において、よく見過ごされる3つの要因を分析した。
論文参考訳（メタデータ） (2022-07-20T01:59:39Z)
SegDiscover: Visual Concept Discovery via Unsupervised Semantic Segmentation [29.809900593362844]
SegDiscoverは、監視なしで複雑なシーンを持つデータセットから意味論的に意味のある視覚概念を発見する新しいフレームワークである。提案手法は, 生画像から概念プリミティブを生成し, 自己教師付き事前学習エンコーダの潜在空間をクラスタリングし, ニューラルネットワークのスムーズ化により概念の洗練を図る。
論文参考訳（メタデータ） (2022-04-22T20:44:42Z)
Sparse Subspace Clustering for Concept Discovery (SSCCD) [1.7319807100654885]
概念は高いレベルの人間の理解の鍵となる構成要素である。局所帰属法では、サンプル間のコヒーレントモデル挙動を特定できない。隠れた特徴層の低次元部分空間として、新しい概念の定義を提唱した。
論文参考訳（メタデータ） (2022-03-11T16:15:48Z)
Discovering Concepts in Learned Representations using Statistical Inference and Interactive Visualization [0.76146285961466]
概念発見は、深層学習の専門家とモデルエンドユーザーの間のギャップを埋めるために重要である。現在のアプローチには、手作りの概念データセットと、それを潜在空間方向に変換することが含まれる。本研究では,複数の仮説テストに基づく意味ある概念のユーザ発見と,インタラクティブな可視化に関する2つのアプローチを提案する。
論文参考訳（メタデータ） (2022-02-09T22:29:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。