論文の概要: A Reply to Makelov et al. (2023)'s "Interpretability Illusion" Arguments
- arxiv url: http://arxiv.org/abs/2401.12631v1
- Date: Tue, 23 Jan 2024 10:27:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 16:06:59.489979
- Title: A Reply to Makelov et al. (2023)'s "Interpretability Illusion" Arguments
- Title(参考訳): Makelov et al. (2023)の「解釈可能性イリュージョン」論への回答
- Authors: Zhengxuan Wu and Atticus Geiger and Jing Huang and Aryaman Arora and
Thomas Icard and Christopher Potts and Noah D. Goodman
- Abstract要約: 我々は、Makelov et al. (2023)が実際に見ているのは、トレーニングと評価のパラダイムの成果であると主張している。
しかし、Makelov et al. (2023) の例と議論は間違いなく解釈可能性の分野を前進させた。
- 参考スコア(独自算出の注目度): 59.87080148922358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We respond to the recent paper by Makelov et al. (2023), which reviews
subspace interchange intervention methods like distributed alignment search
(DAS; Geiger et al. 2023) and claims that these methods potentially cause
"interpretability illusions". We first review Makelov et al. (2023)'s technical
notion of what an "interpretability illusion" is, and then we show that even
intuitive and desirable explanations can qualify as illusions in this sense. As
a result, their method of discovering "illusions" can reject explanations they
consider "non-illusory". We then argue that the illusions Makelov et al. (2023)
see in practice are artifacts of their training and evaluation paradigms. We
close by emphasizing that, though we disagree with their core characterization,
Makelov et al. (2023)'s examples and discussion have undoubtedly pushed the
field of interpretability forward.
- Abstract(参考訳): 我々は、分散アライメント探索 (das; geiger et al. 2023) のような部分空間交換介入法をレビューしたmakelov et al. (2023) の最近の論文に応答し、これらの方法が「解釈可能性錯覚」を引き起こす可能性があると主張している。
我々はまず、Makelov et al. (2023) の技術的概念である「解釈可能性錯覚」を概観し、さらに直観的で望ましい説明でさえ、この意味での錯覚とみなすことができることを示した。
その結果、彼らの「幻想」を発見する方法は、彼らが「非幻想」と考える説明を拒絶することができる。
次に、Makelov et al. (2023) が実際に見る錯覚は、その訓練と評価のパラダイムの人工物であると主張する。
我々は、それらの中核的な特徴とは対照的に、Makelov et al. (2023) の例と議論は間違いなく解釈可能性の分野を前進させたことを強調した。
関連論文リスト
- Dissenting Explanations: Leveraging Disagreement to Reduce Model
Overreliance [5.5769831014164675]
本稿では, 矛盾する説明, 付随する説明と矛盾する予測について紹介する。
まず、モデル乗法の設定における不一致の説明の利点を考察する。
本研究では,不一致説明が全体の精度を低下させることなく,モデル予測の過度な信頼性を低下させることを実証する。
論文 参考訳(メタデータ) (2023-07-14T21:27:00Z) - Counterfactual Explanations for Misclassified Images: How Human and
Machine Explanations Differ [11.508304497344637]
ブラックボックスのディープラーニングシステムの予測を解明する、eXplainable AI(XAI)問題に対する一般的なソリューションとして、カウンターファクトの説明が登場した。
100以上の対策方法が存在し、人々が好むものに似た、もっともらしい説明を生成すると主張しているが、実際にユーザでテストされているものはほとんどない。
ここでは, 誤分類画像に対する人間生成の反実的説明を根底から収集する新たな手法を用いて, この問題に対処する。
論文 参考訳(メタデータ) (2022-12-16T22:05:38Z) - Reply to "Comment on 'Why interference phenomena do not capture the
essence of quantum theory' " [0.0]
我々は、伝統的に問題と見なされる干渉の現象論は、実際には量子論の本質を捉えていないと論じる。
これは、この現象論を再現するが、古典的世界観を犠牲にしない「トイ場理論」と呼ばれる物理理論の存在を実証することによるものである。
論文 参考訳(メタデータ) (2022-07-24T18:59:35Z) - Does Science need Intersubjectivity? The Problem of Confirmation in
Orthodox Interpretations of Quantum Mechanics [0.0]
我々は、量子力学の成功した解釈は、我々の経験的証拠が量子力学について知るのにどのように役立つかを説明する必要があると論じている。
我々は、正統的な解釈によって仮定される宇宙の種類において、信念の更新がどのように機能するかを詳細に見ていく。
これらの解釈のいくつかのバージョンでは、経験的確認のために自分自身の相対周波数を使うことさえ不可能であると主張する。
論文 参考訳(メタデータ) (2022-03-30T13:14:34Z) - The Abduction of Sherlock Holmes: A Dataset for Visual Abductive
Reasoning [113.25016899663191]
人間は、画像のリテラルの内容を超えるものについて、誘惑的に推論し仮説を立てる能力がある。
本稿では,103K画像の注釈付きコーパスであるSherlockについて述べる。
論文 参考訳(メタデータ) (2022-02-10T02:26:45Z) - Human Interpretation of Saliency-based Explanation Over Text [65.29015910991261]
テキストデータ上でのサリエンシに基づく説明について検討する。
人はしばしば説明を誤って解釈する。
本稿では,過度知覚と過小認識のモデル推定に基づいて,サリエンシを調整する手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T15:20:32Z) - The Who in XAI: How AI Background Shapes Perceptions of AI Explanations [61.49776160925216]
私たちは、2つの異なるグループ、つまりAIのバックグラウンドを持つ人々といない人たちの、異なるタイプのAI説明に対する理解について、混合手法による研究を行います。
その結果,(1) 両群は異なる理由から不合理な数に対する信頼を示し,(2) それぞれの群は意図した設計以上の異なる説明に価値を見出した。
論文 参考訳(メタデータ) (2021-07-28T17:32:04Z) - Explainers in the Wild: Making Surrogate Explainers Robust to
Distortions through Perception [77.34726150561087]
説明における歪みの影響を知覚距離を埋め込むことで評価する手法を提案する。
Imagenet-Cデータセットの画像の説明を生成し、サロゲート説明書の知覚距離を使用して歪んだ画像と参照画像のより一貫性のある説明を作成する方法を示しています。
論文 参考訳(メタデータ) (2021-02-22T12:38:53Z) - Are Interpretations Fairly Evaluated? A Definition Driven Pipeline for
Post-Hoc Interpretability [54.85658598523915]
我々は,解釈の忠実性を評価する前に,解釈を明確に定義することを提案する。
解釈手法は,ある評価基準の下で異なる性能を示すが,その差は解釈の品質や忠実さから生じるものではない。
論文 参考訳(メタデータ) (2020-09-16T06:38:03Z) - Quantum Theory Needs No 'Interpretation' But 'Theoretical
Formal-Conceptual Unity' (Or: Escaping Adan Cabello's "Map of Madness" With
the Help of David Deutsch's Explanations) [0.0]
我々は、量子論の「解釈」が反現実主義者によって設計された罠として機能していると考える理由があると主張している。
アインシュタインが1世紀ほど前にハイゼンベルクに語ったように、この解釈の反現実主義的罠から逃れる鍵は、何が観察できるかを教えてくれる理論に過ぎません。
論文 参考訳(メタデータ) (2020-08-01T19:10:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。