Fugu-MT 論文翻訳(概要): ProtoS-ViT: Visual foundation models for sparse self-explainable classifications

論文の概要: ProtoS-ViT: Visual foundation models for sparse self-explainable classifications

arxiv url: http://arxiv.org/abs/2406.10025v1
Date: Fri, 14 Jun 2024 13:36:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-17 13:35:39.733696
Title: ProtoS-ViT: Visual foundation models for sparse self-explainable classifications
Title（参考訳）: ProtoS-ViT:スパース自己説明可能な分類のための視覚基盤モデル
Authors: Hugues Turbé, Mina Bjelogrlic, Gianmarco Mengaldo, Christian Lovis,
Abstract要約: この研究は、凍結したトレーニング済みのViTバックボーンが、いかに効果的に原型モデルに変換できるかを示す。 ProtoS-ViTは、精度、コンパクト性、説明可能性の点で優れた性能を示す既存のプロトタイプモデルを上回る。
参考スコア（独自算出の注目度）: 0.6249768559720122
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Prototypical networks aim to build intrinsically explainable models based on the linear summation of concepts. However, important challenges remain in the transparency, compactness, and meaningfulness of the explanations provided by these models. This work demonstrates how frozen pre-trained ViT backbones can be effectively turned into prototypical models for both general and domain-specific tasks, in our case biomedical image classifiers. By leveraging strong spatial features combined with a novel prototypical head, ProtoS-ViT surpasses existing prototypical models showing strong performance in terms of accuracy, compactness, and explainability. Model explainability is evaluated through an extensive set of quantitative and qualitative metrics which serve as a general benchmark for the development of prototypical models. Code is available at https://github.com/hturbe/protosvit.
Abstract（参考訳）: プロトタイプネットワークは、概念の線形和に基づいて本質的に説明可能なモデルを構築することを目的としている。しかし、これらのモデルが提供する説明の透明性、コンパクト性、有意義性には重要な課題が残っている。本研究は、凍結したViTバックボーンが、一般的なタスクとドメイン固有のタスクの両方のプロトタイプモデルに効果的に変換可能であることを示す。 ProtoS-ViTは、新しい原型ヘッドと組み合わされた強い空間的特徴を利用することで、精度、コンパクト性、説明可能性の点で、優れた性能を示す既存の原型モデルを上回っている。モデル説明可能性の評価は、原型モデルの開発のための一般的なベンチマークとして機能する、量的および質的なメトリクスの広範なセットを通じて行われる。コードはhttps://github.com/hturbe/protosvit.comから入手できる。

関連論文リスト

Interpretable Image Classification via Non-parametric Part Prototype Learning [14.390730075612248]
解釈可能な意思決定プロセスで画像を分類することは、コンピュータビジョンにおける長年の問題である。近年、自己説明可能なニューラルネットワークのアプローチとして、プロトタイプのPart Networksが注目を集めている。本稿では,各クラスに対して意味的に固有のオブジェクト部品の集合を学習する,部分的解釈可能な画像分類のためのフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-13T10:46:53Z)
Jet: A Modern Transformer-Based Normalizing Flow [62.2573739835562]
本稿では,結合型正規化フローモデルの設計を再考する。よりシンプルなアーキテクチャで、最先端の定量的、質的なパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-12-19T18:09:42Z)
Free Lunch in Pathology Foundation Model: Task-specific Model Adaptation with Concept-Guided Feature Enhancement [18.839406725114042]
概念アンカー誘導型タスク固有特徴強調(CATE)を提案する。 CATEは、特定の下流タスクに対する病理基盤モデルの表現性と識別性を高めることができる。パブリックなWSIデータセットの実験は、CATEがMILモデルの性能と一般化性を著しく向上させることを示した。
論文参考訳（メタデータ） (2024-11-15T02:38:00Z)
Interpretable Image Classification with Adaptive Prototype-based Vision Transformers [37.62530032165594]
本稿では,ディープラーニングとケースベース推論を組み合わせた画像分類手法であるProtoViTを提案する。我々のモデルは、視覚変換器(ViT)のバックボーンをプロトタイプベースモデルに統合し、空間的に変形したプロトタイプを提供する。実験の結果,本モデルでは既存のプロトタイプモデルよりも高い性能が得られることがわかった。
論文参考訳（メタデータ） (2024-10-28T04:33:28Z)
Towards Compositional Interpretability for XAI [3.3768167170511587]
本稿では,カテゴリ理論に基づくAIモデルとその解釈可能性の定義手法を提案する。我々は、幅広いAIモデルを構成モデルと比較する。標準の'本質的に解釈可能な'モデルを作るものは、最も明確に図式化されます。
論文参考訳（メタデータ） (2024-06-25T14:27:03Z)
Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文参考訳（メタデータ） (2024-02-07T13:41:53Z)
A Recursive Bateson-Inspired Model for the Generation of Semantic Formal Concepts from Spatial Sensory Data [77.34726150561087]
本稿では,複雑な感覚データから階層構造を生成するための記号のみの手法を提案する。このアプローチは、概念や概念の創始の鍵としてのバテソンの差異の概念に基づいている。このモデルは、トレーニングなしでかなりリッチだが人間に読まれる概念表現を生成することができる。
論文参考訳（メタデータ） (2023-07-16T15:59:13Z)
Prototype Learning for Explainable Brain Age Prediction [1.104960878651584]
回帰タスクに特化して設計された,説明可能なプロトタイプベースモデルであるExPeRTを提案する。提案モデルでは,プロトタイプラベルの重み付き平均値を用いて,学習したプロトタイプのラテント空間における距離からサンプル予測を行う。提案手法は,モデル推論プロセスに関する知見を提供しながら,最先端の予測性能を実現した。
論文参考訳（メタデータ） (2023-06-16T14:13:21Z)
Representer Point Selection for Explaining Regularized High-dimensional Models [105.75758452952357]
本稿では,高次元表現器と呼ぶサンプルベース説明のクラスを紹介する。私たちのワークホースは、一般化された高次元モデルに対する新しい代表者定理である。提案手法の実証的性能について,実世界の2進分類データセットと2つの推薦システムデータセットを用いて検討した。
論文参考訳（メタデータ） (2023-05-31T16:23:58Z)
Counterfactual Edits for Generative Evaluation [0.0]
本稿では,画素の代わりに概念に基づく合成結果の評価と説明のためのフレームワークを提案する。我々のフレームワークは、どのオブジェクトや属性を挿入、削除、または置き換えるべきかを下記した知識ベースの偽物編集を利用する。局所的な編集を蓄積したグローバルな説明は、モデルが合計で生成できない概念を明らかにすることもできる。
論文参考訳（メタデータ） (2023-03-02T20:10:18Z)
Investigating Ensemble Methods for Model Robustness Improvement of Text Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文参考訳（メタデータ） (2022-10-28T17:52:10Z)
ProtoVAE: A Trustworthy Self-Explainable Prototypical Variational Model [18.537838366377915]
ProtoVAEは、クラス固有のプロトタイプをエンドツーエンドで学習する変分自動エンコーダベースのフレームワークである。表現空間を正規化し、正則性制約を導入することにより、信頼性と多様性を強制する。
論文参考訳（メタデータ） (2022-10-15T00:42:13Z)
IterMiUnet: A lightweight architecture for automatic blood vessel segmentation [10.538564380139483]
本稿では,新しい軽量畳み込み型セグメンテーションモデルであるIterMiUnetを提案する。 MiUnetモデルのエンコーダ・デコーダ構造を組み込むことで、その非常にパラメトリズドな性質を克服する。提案モデルは,多くの疾患の早期診断のためのツールとして活用される可能性が大きい。
論文参考訳（メタデータ） (2022-08-02T14:33:14Z)
Low-Rank Constraints for Fast Inference in Structured Models [110.38427965904266]
この研究は、大規模構造化モデルの計算とメモリの複雑さを低減するための単純なアプローチを示す。言語モデリング,ポリフォニック・ミュージック・モデリング,教師なし文法帰納法,ビデオ・モデリングのためのニューラルパラメータ構造モデルを用いた実験により,我々の手法は大規模状態空間における標準モデルの精度と一致することを示した。
論文参考訳（メタデータ） (2022-01-08T00:47:50Z)
Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文参考訳（メタデータ） (2021-05-14T06:58:44Z)
Polynomial Networks in Deep Classifiers [55.90321402256631]
我々は深層ニューラルネットワークの研究を統一的な枠組みで行った。私たちのフレームワークは、各モデルの誘導バイアスに関する洞察を提供します。提案モデルの有効性を,標準画像および音声分類ベンチマークで評価した。
論文参考訳（メタデータ） (2021-04-16T06:41:20Z)
Generative Counterfactuals for Neural Networks via Attribute-Informed Perturbation [51.29486247405601]
AIP(Attribute-Informed Perturbation)の提案により,生データインスタンスの反事実を生成するフレームワークを設計する。異なる属性を条件とした生成モデルを利用することで、所望のラベルとの反事実を効果的かつ効率的に得ることができる。実世界のテキストや画像に対する実験結果から, 設計したフレームワークの有効性, サンプル品質, および効率が示された。
論文参考訳（メタデータ） (2021-01-18T08:37:13Z)
Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文参考訳（メタデータ） (2020-10-25T18:51:15Z)
Generative Neurosymbolic Machines [26.364503276512153]
記号的表現と分散表現の再構成は、現在のディープラーニングの限界を解決できる重要な課題である。本稿では、分布表現とシンボル表現の利点を組み合わせた生成モデルである生成型ニューロシンボリックマシンを提案し、シンボル成分の構造化表現と密度ベース生成の両方をサポートする。
論文参考訳（メタデータ） (2020-10-23T04:02:13Z)
A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文参考訳（メタデータ） (2020-09-25T12:01:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。