論文の概要: ProtoQuant: Quantization of Prototypical Parts For General and Fine-Grained Image Classification
- arxiv url: http://arxiv.org/abs/2602.06592v1
- Date: Fri, 06 Feb 2026 10:41:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.358355
- Title: ProtoQuant: Quantization of Prototypical Parts For General and Fine-Grained Image Classification
- Title(参考訳): ProtoQuant: 画像分類のためのプロトタイプ部品の量子化
- Authors: Mikołaj Janusz, Adam Wróbel, Bartosz Zieliński, Dawid Rymarczyk,
- Abstract要約: ProtoQuantは、プロトタイプの安定性と基盤となる解釈可能性を実現する新しいアーキテクチャである。
潜伏した空間内で、プロトタイプを個別に学習したコードブックに制限することにより、バックボーンを更新することなく、トレーニングデータの忠実な表現を確実に維持できます。
この設計により、ProtoQuantは大規模データセットにスケールする効率的で解釈可能なヘッドとして機能する。
- 参考スコア(独自算出の注目度): 3.4335395164627722
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prototypical parts-based models offer a "this looks like that" paradigm for intrinsic interpretability, yet they typically struggle with ImageNet-scale generalization and often require computationally expensive backbone finetuning. Furthermore, existing methods frequently suffer from "prototype drift," where learned prototypes lack tangible grounding in the training distribution and change their activation under small perturbations. We present ProtoQuant, a novel architecture that achieves prototype stability and grounded interpretability through latent vector quantization. By constraining prototypes to a discrete learned codebook within the latent space, we ensure they remain faithful representations of the training data without the need to update the backbone. This design allows ProtoQuant to function as an efficient, interpretable head that scales to large-scale datasets. We evaluate ProtoQuant on ImageNet and several fine-grained benchmarks (CUB-200, Cars-196). Our results demonstrate that ProtoQuant achieves competitive classification accuracy while generalizing to ImageNet and comparable interpretability metrics to other prototypical-parts-based methods.
- Abstract(参考訳): 原型的な部品ベースのモデルは、本質的な解釈可能性のための"このような"パラダイムを提供するが、一般的にイメージネットスケールの一般化に苦慮し、計算的に高価なバックボーンの微調整を必要とする。
さらに、既存の手法はしばしば「原型漂流」に悩まされ、学習された試作機は訓練分布の具体的な基盤を欠き、小さな摂動下での活性化を変化させる。
提案するProtoQuantは,潜在ベクトル量子化によるプロトタイプ安定性と基底解釈性を実現する新しいアーキテクチャである。
潜伏した空間内で、プロトタイプを個別に学習したコードブックに制限することにより、バックボーンを更新することなく、トレーニングデータの忠実な表現を確実に維持できます。
この設計により、ProtoQuantは大規模データセットにスケールする効率的で解釈可能なヘッドとして機能する。
我々はImageNetといくつかのきめ細かいベンチマーク(CUB-200, Cars-196)でProtoQuantを評価した。
この結果から, ProtoQuantは,ImageNetおよびそれと同等の解釈可能性指標を他のプロトタイプ部分法と比較しながら,競合する分類精度を達成できることが示唆された。
関連論文リスト
- Proto-Former: Unified Facial Landmark Detection by Prototype Transformer [77.47431726595111]
Proto-Formerは、統一的で適応的でエンドツーエンドの顔ランドマーク検出フレームワークである。
統一されたアーキテクチャ内で、複数のデータセットをまたいだ共同トレーニングを可能にする。
Proto-Formerは、既存の最先端手法よりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-17T06:00:25Z) - Interpretable Image Classification with Adaptive Prototype-based Vision Transformers [37.62530032165594]
本稿では,ディープラーニングとケースベース推論を組み合わせた画像分類手法であるProtoViTを提案する。
我々のモデルは、視覚変換器(ViT)のバックボーンをプロトタイプベースモデルに統合し、空間的に変形したプロトタイプを提供する。
実験の結果,本モデルでは既存のプロトタイプモデルよりも高い性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-10-28T04:33:28Z) - Multi-Scale Grouped Prototypes for Interpretable Semantic Segmentation [7.372346036256517]
意味的セグメンテーションを解釈可能なものにするための、有望なアプローチとして、プロトタイプ的な部分学習が登場している。
本稿では,多スケール画像表現を利用した意味的セグメンテーションの解釈手法を提案する。
Pascal VOC,Cityscapes,ADE20Kで行った実験により,提案手法はモデルの疎結合性を高め,既存のプロトタイプ手法よりも解釈可能性を高め,非解釈可能なモデルとの性能ギャップを狭めることを示した。
論文 参考訳(メタデータ) (2024-09-14T17:52:59Z) - Correlation Weighted Prototype-based Self-Supervised One-Shot Segmentation of Medical Images [12.365801596593936]
医用画像セグメンテーションは、十分な注釈付きデータが入手できない領域の1つである。
スーパーピクセルから生成された擬似ラベルを用いた,プロトタイプベースのワンショット学習フレームワークを提案する。
提案手法は,最先端の手法と同等に機能することを示す。
論文 参考訳(メタデータ) (2024-08-12T15:38:51Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - With a Little Help from your own Past: Prototypical Memory Networks for
Image Captioning [47.96387857237473]
我々は、他のトレーニングサンプルを処理しながら得られたアクティベーションに注意を向けるネットワークを考案した。
私たちのメモリは、プロトタイプベクトルの定義を通じて過去のキーと値の分布をモデル化します。
本研究では,エンコーダ・デコーダ変換器の性能を3.7 CIDErポイント向上できることを示す。
論文 参考訳(メタデータ) (2023-08-23T18:53:00Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Deformable ProtoPNet: An Interpretable Image Classifier Using Deformable Prototypes [7.8515366468594765]
本稿では,Deformable Part Network(Deformable ProtoPNet)を提案する。
このモデルは、学習中に学習したプロトタイプと比較し、入力画像の分類を行い、「これのように見える」という形で説明を与える。
論文 参考訳(メタデータ) (2021-11-29T22:38:13Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。