Fugu-MT 論文翻訳(概要): Interpretable Image Classification with Adaptive Prototype-based Vision Transformers

論文の概要: Interpretable Image Classification with Adaptive Prototype-based Vision Transformers

arxiv url: http://arxiv.org/abs/2410.20722v1
Date: Mon, 28 Oct 2024 04:33:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:41.141022
Title: Interpretable Image Classification with Adaptive Prototype-based Vision Transformers
Title（参考訳）: Adaptive Prototype-based Vision Transformer を用いた解釈可能な画像分類
Authors: Chiyu Ma, Jon Donnelly, Wenjun Liu, Soroush Vosoughi, Cynthia Rudin, Chaofan Chen,
Abstract要約: 本稿では,ディープラーニングとケースベース推論を組み合わせた画像分類手法であるProtoViTを提案する。我々のモデルは、視覚変換器(ViT)のバックボーンをプロトタイプベースモデルに統合し、空間的に変形したプロトタイプを提供する。実験の結果,本モデルでは既存のプロトタイプモデルよりも高い性能が得られることがわかった。
参考スコア（独自算出の注目度）: 37.62530032165594
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present ProtoViT, a method for interpretable image classification combining deep learning and case-based reasoning. This method classifies an image by comparing it to a set of learned prototypes, providing explanations of the form ``this looks like that.'' In our model, a prototype consists of \textit{parts}, which can deform over irregular geometries to create a better comparison between images. Unlike existing models that rely on Convolutional Neural Network (CNN) backbones and spatially rigid prototypes, our model integrates Vision Transformer (ViT) backbones into prototype based models, while offering spatially deformed prototypes that not only accommodate geometric variations of objects but also provide coherent and clear prototypical feature representations with an adaptive number of prototypical parts. Our experiments show that our model can generally achieve higher performance than the existing prototype based models. Our comprehensive analyses ensure that the prototypes are consistent and the interpretations are faithful.
Abstract（参考訳）: 本稿では,ディープラーニングとケースベース推論を組み合わせた画像分類手法であるProtoViTを提案する。この方法では、画像を学習したプロトタイプのセットと比較することで、イメージを分類し、 ` This looks that" という形式の説明を提供する。私たちのモデルでは、プロトタイプは \textit{parts} で構成されています。畳み込みニューラルネットワーク(CNN)のバックボーンと空間的に剛性のあるプロトタイプに依存する既存のモデルとは異なり、我々のモデルは視覚変換器(ViT)のバックボーンをプロトタイプベースモデルに統合するとともに、空間的に変形したプロトタイプを提供する。実験の結果,我々のモデルは既存のプロトタイプモデルよりも高い性能が得られることがわかった。我々の包括的な分析は、プロトタイプが一貫性があり、解釈が忠実であることを保証する。

関連論文リスト

ProtoQuant: Quantization of Prototypical Parts For General and Fine-Grained Image Classification [3.4335395164627722]
ProtoQuantは、プロトタイプの安定性と基盤となる解釈可能性を実現する新しいアーキテクチャである。潜伏した空間内で、プロトタイプを個別に学習したコードブックに制限することにより、バックボーンを更新することなく、トレーニングデータの忠実な表現を確実に維持できます。この設計により、ProtoQuantは大規模データセットにスケールする効率的で解釈可能なヘッドとして機能する。
論文参考訳（メタデータ） (2026-02-06T10:41:31Z)
Proto-Former: Unified Facial Landmark Detection by Prototype Transformer [77.47431726595111]
Proto-Formerは、統一的で適応的でエンドツーエンドの顔ランドマーク検出フレームワークである。統一されたアーキテクチャ内で、複数のデータセットをまたいだ共同トレーニングを可能にする。 Proto-Formerは、既存の最先端手法よりも優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-10-17T06:00:25Z)
Mind the Gap Between Prototypes and Images in Cross-domain Finetuning [64.97317635355124]
プロトタイプと画像にそれぞれ異なる変換を適用するために,コントラスト型プロトタイプイメージ適応(CoPA)を提案する。 Meta-Datasetの実験では、CoPAが最先端のパフォーマンスをより効率的に達成できることが示されている。
論文参考訳（メタデータ） (2024-10-16T11:42:11Z)
Multi-Scale Grouped Prototypes for Interpretable Semantic Segmentation [7.372346036256517]
意味的セグメンテーションを解釈可能なものにするための、有望なアプローチとして、プロトタイプ的な部分学習が登場している。本稿では,多スケール画像表現を利用した意味的セグメンテーションの解釈手法を提案する。 Pascal VOC,Cityscapes,ADE20Kで行った実験により,提案手法はモデルの疎結合性を高め,既存のプロトタイプ手法よりも解釈可能性を高め,非解釈可能なモデルとの性能ギャップを狭めることを示した。
論文参考訳（メタデータ） (2024-09-14T17:52:59Z)
Query-guided Prototype Evolution Network for Few-Shot Segmentation [85.75516116674771]
本稿では,前景と背景のプロトタイプの生成プロセスにクエリ機能を統合する新しい手法を提案する。 PASCAL-$5i$とミラーリング-$20i$データセットの実験結果は、QPENetが達成した実質的な拡張を示している。
論文参考訳（メタデータ） (2024-03-11T07:50:40Z)
ProtoP-OD: Explainable Object Detection with Prototypical Parts [0.0]
本稿では、原型的局所特徴を構築し、オブジェクト検出に使用するトランスフォーマーの検出拡張を提案する。提案した拡張は、プロトタイプアクティベーションの離散化表現を演算するボトルネックモジュール、プロトタイプネックで構成されている。
論文参考訳（メタデータ） (2024-02-29T13:25:15Z)
This Looks Like Those: Illuminating Prototypical Concepts Using Multiple Visualizations [19.724372592639774]
ProtoConceptsは,ディープラーニングとケースベース推論を組み合わせた画像分類手法である。提案手法は,プロトタイプベースネットワークのアーキテクチャを改良し,複数のイメージパッチを用いて視覚化された概念を学習する。実験の結果,この手法は,既存の画像分類網の広範な変更として適用可能であることがわかった。
論文参考訳（メタデータ） (2023-10-28T04:54:48Z)
Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文参考訳（メタデータ） (2022-03-28T21:15:32Z)
Interpretable Image Classification with Differentiable Prototypes Assignment [7.660883761395447]
クラスが共有するプロトタイプのプールを備えた解釈可能な画像分類モデルであるProtoPoolを紹介する。プロトタイプを特定のクラスに完全に微分可能な割り当てを導入することで得られる。我々は,CUB-200-2011とStanford Carsのデータセットにおいて,ProtoPoolが最先端の精度を得ることを示す。
論文参考訳（メタデータ） (2021-12-06T10:03:32Z)
Deformable ProtoPNet: An Interpretable Image Classifier Using Deformable Prototypes [7.8515366468594765]
本稿では,Deformable Part Network(Deformable ProtoPNet)を提案する。このモデルは、学習中に学習したプロトタイプと比較し、入力画像の分類を行い、「これのように見える」という形で説明を与える。
論文参考訳（メタデータ） (2021-11-29T22:38:13Z)
Meta Internal Learning [88.68276505511922]
単一画像生成のための内部学習は、単一の画像に基づいて新しい画像を生成するようにジェネレータを訓練するフレームワークである。本稿では,サンプル画像の内部統計をより効果的にモデル化するために,画像集合のトレーニングを可能にするメタラーニング手法を提案する。以上の結果から, 得られたモデルは, 多数の共通画像アプリケーションにおいて, シングルイメージのGANと同程度に適していることがわかった。
論文参考訳（メタデータ） (2021-10-06T16:27:38Z)
Learning Sparse Prototypes for Text Generation [120.38555855991562]
プロトタイプ駆動のテキスト生成は、トレーニングコーパス全体の保存とインデックスを必要とするため、テスト時に非効率である。本稿では,言語モデリング性能を向上するスパースなプロトタイプサポートセットを自動的に学習する新しい生成モデルを提案する。実験では,1000倍のメモリ削減を実現しつつ,従来のプロトタイプ駆動型言語モデルよりも優れていた。
論文参考訳（メタデータ） (2020-06-29T19:41:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。