Fugu-MT 論文翻訳(概要): Enhancing Performance of Explainable AI Models with Constrained Concept Refinement

論文の概要: Enhancing Performance of Explainable AI Models with Constrained Concept Refinement

arxiv url: http://arxiv.org/abs/2502.06775v1
Date: Mon, 10 Feb 2025 18:53:15 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-11 18:57:51.730445
Title: Enhancing Performance of Explainable AI Models with Constrained Concept Refinement
Title（参考訳）: 制約付きコンセプトリファインメントを用いた説明可能なAIモデルの性能向上
Authors: Geyu Liang, Senne Michielssen, Salar Fattahi,
Abstract要約: 正確性と解釈可能性のトレードオフは、機械学習(ML)における長年の課題である。本稿では,概念表現における偏差の影響について検討し,これらの効果を緩和するための新しい枠組みを提案する。従来の説明可能な手法と比較して,提案手法は様々な大規模ベンチマークにおいてモデル解釈可能性を維持しながら予測精度を向上するだけでなく,計算コストを大幅に削減する。
参考スコア（独自算出の注目度）: 10.241134756773228
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The trade-off between accuracy and interpretability has long been a challenge in machine learning (ML). This tension is particularly significant for emerging interpretable-by-design methods, which aim to redesign ML algorithms for trustworthy interpretability but often sacrifice accuracy in the process. In this paper, we address this gap by investigating the impact of deviations in concept representations-an essential component of interpretable models-on prediction performance and propose a novel framework to mitigate these effects. The framework builds on the principle of optimizing concept embeddings under constraints that preserve interpretability. Using a generative model as a test-bed, we rigorously prove that our algorithm achieves zero loss while progressively enhancing the interpretability of the resulting model. Additionally, we evaluate the practical performance of our proposed framework in generating explainable predictions for image classification tasks across various benchmarks. Compared to existing explainable methods, our approach not only improves prediction accuracy while preserving model interpretability across various large-scale benchmarks but also achieves this with significantly lower computational cost.
Abstract（参考訳）: 正確性と解釈可能性のトレードオフは、機械学習(ML)における長年の課題である。この緊張は、MLアルゴリズムを信頼性の高い解釈可能性のために再設計することを目的としているが、そのプロセスにおける精度を犠牲にすることも多い。本稿では,概念表現における偏差の影響を考察し,解釈可能なモデルの予測性能に不可欠な要素として,これらの効果を緩和するための新しい枠組みを提案する。このフレームワークは、解釈可能性を維持する制約の下で概念埋め込みを最適化する原則に基づいている。生成モデルをテストベッドとして使用することにより,アルゴリズムがゼロ損失を達成すると同時に,結果の解釈可能性も徐々に向上することを示す。さらに,様々なベンチマークを用いて,画像分類タスクに対する説明可能な予測を生成する上で,提案手法の実用的性能を評価する。従来の説明可能な手法と比較して,提案手法は様々な大規模ベンチマークにおいてモデル解釈可能性を維持しながら予測精度を向上するだけでなく,計算コストを大幅に削減する。

関連論文リスト

Partial Transportability for Domain Generalization [56.37032680901525]
本稿では, 部分的同定と輸送可能性の理論に基づいて, 対象分布の関数値の有界化に関する新たな結果を紹介する。我々の貢献は、輸送可能性問題に対する最初の一般的な評価手法を提供することである。本稿では,スケーラブルな推論を実現するための勾配に基づく最適化手法を提案する。
論文参考訳（メタデータ） (2025-03-30T22:06:37Z)
Adaptive Test-Time Intervention for Concept Bottleneck Models [6.31833744906105]
概念ボトルネックモデル(CBM)は、人間レベルの「概念」を予測することによってモデルの解釈可能性を改善することを目的としている我々は,2成分蒸留(BD)を得るためにFIGS(Fast Interpretable Greedy Sum-Trees)を提案する。 FIGS-BDは、CBMのバイナリ拡張されたコンセプト・トゥ・ターゲット部分を解釈可能なツリーベースモデルに蒸留する。
論文参考訳（メタデータ） (2025-03-09T19:03:48Z)
Rigorous Probabilistic Guarantees for Robust Counterfactual Explanations [80.86128012438834]
モデルシフトに対する反ファクトの堅牢性を計算することはNP完全であることを示す。本稿では,頑健性の厳密な推定を高い保証で実現する新しい確率論的手法を提案する。
論文参考訳（メタデータ） (2024-07-10T09:13:11Z)
Fast Explanations via Policy Gradient-Optimized Explainer [7.011763596804071]
本稿では,確率分布による帰属に基づく説明を表現する新しい枠組みを提案する。提案するフレームワークは、リアルタイムで大規模なモデル説明のための堅牢でスケーラブルなソリューションを提供する。画像とテキストの分類作業におけるフレームワークの有効性を検証するとともに,提案手法は推論時間を97%以上削減し,メモリ使用量を70%以上削減することを示した。
論文参考訳（メタデータ） (2024-05-29T00:01:40Z)
Benchmarking and Enhancing Disentanglement in Concept-Residual Models [4.177318966048984]
概念ボトルネックモデル (CBM) は、まず意味論的に意味のある一連の特徴を予測する解釈可能なモデルである。 CBMの性能はエンジニアリングされた機能に依存しており、不完全な概念のセットに苦しむことがある。本研究は,情報漏洩を解消するための3つの新しい手法を提案する。
論文参考訳（メタデータ） (2023-11-30T21:07:26Z)
Surprisal Driven $k$-NN for Robust and Interpretable Nonparametric Learning [1.4293924404819704]
我々は情報理論の観点から、隣り合う従来のアルゴリズムに新たな光を当てた。単一モデルを用いた分類,回帰,密度推定,異常検出などのタスクに対する頑健で解釈可能なフレームワークを提案する。我々の研究は、分類と異常検出における最先端の成果を達成することによって、アーキテクチャの汎用性を示す。
論文参考訳（メタデータ） (2023-11-17T00:35:38Z)
Explaining Language Models' Predictions with High-Impact Concepts [11.47612457613113]
概念ベースの解釈可能性手法をNLPに拡張するための完全なフレームワークを提案する。出力予測が大幅に変化する特徴を最適化する。本手法は, ベースラインと比較して, 予測的影響, ユーザビリティ, 忠実度に関する優れた結果が得られる。
論文参考訳（メタデータ） (2023-05-03T14:48:27Z)
Explain, Adapt and Retrain: How to improve the accuracy of a PPM classifier through different explanation styles [4.6281736192809575]
最近の論文では、結果指向の予測に予測プロセスモニタリングモデルがなぜ間違った予測を提供するのかを説明するための新しいアプローチが紹介されている。半自動的な方法でミスを犯す予測者を誘導する最も一般的な特徴を特定するために、説明を利用する方法を示す。
論文参考訳（メタデータ） (2023-03-27T06:37:55Z)
Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文参考訳（メタデータ） (2021-05-14T06:58:44Z)
Robust Semantic Interpretability: Revisiting Concept Activation Vectors [0.0]
画像分類のための解釈可能性手法は、モデルが系統的に偏りがあるか、あるいは人間と同じ手掛かりに従うかを明らかにすることを試みる。提案するRobust Concept Activation Vectors (RCAV) は,個々のモデル予測やモデル全体の振る舞いに対する意味概念の影響を定量化する。
論文参考訳（メタデータ） (2021-04-06T20:14:59Z)
Generative Counterfactuals for Neural Networks via Attribute-Informed Perturbation [51.29486247405601]
AIP(Attribute-Informed Perturbation)の提案により,生データインスタンスの反事実を生成するフレームワークを設計する。異なる属性を条件とした生成モデルを利用することで、所望のラベルとの反事実を効果的かつ効率的に得ることができる。実世界のテキストや画像に対する実験結果から, 設計したフレームワークの有効性, サンプル品質, および効率が示された。
論文参考訳（メタデータ） (2021-01-18T08:37:13Z)
Trust but Verify: Assigning Prediction Credibility by Counterfactual Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文参考訳（メタデータ） (2020-11-24T19:52:38Z)
Towards a Theoretical Understanding of the Robustness of Variational Autoencoders [82.68133908421792]
敵攻撃や他の入力摂動に対する変分オートエンコーダ(VAE)の堅牢性を理解するために,我々は進出している。確率モデルにおけるロバスト性のための新しい基準である$r$-robustnessを開発する。遠心法を用いて訓練したVAEが、ロバストネスの指標でよく評価されていることを示す。
論文参考訳（メタデータ） (2020-07-14T21:22:29Z)
Efficient Ensemble Model Generation for Uncertainty Estimation with Bayesian Approximation in Segmentation [74.06904875527556]
アンサンブルセグメンテーションモデルを構築するための汎用的で効率的なセグメンテーションフレームワークを提案する。提案手法では,層選択法を用いて効率よくアンサンブルモデルを生成することができる。また,新たな画素単位の不確実性損失を考案し,予測性能を向上する。
論文参考訳（メタデータ） (2020-05-21T16:08:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。