論文の概要: PDiscoNet: Semantically consistent part discovery for fine-grained
recognition
- arxiv url: http://arxiv.org/abs/2309.03173v1
- Date: Wed, 6 Sep 2023 17:19:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 14:24:43.694556
- Title: PDiscoNet: Semantically consistent part discovery for fine-grained
recognition
- Title(参考訳): PDiscoNet: 微粒化認識のための意味的に一貫した部分発見
- Authors: Robert van der Klis, Stephan Alaniz, Massimiliano Mancini, Cassio F.
Dantas, Dino Ienco, Zeynep Akata, Diego Marcos
- Abstract要約: 画像レベルのクラスラベルのみを用いて,対象部品の発見を推奨する先行情報とともにPDiscoNetを提案する。
CUB,CelebA,PartImageNet で得られた結果から,提案手法は従来手法よりもかなり優れた部分発見性能が得られることがわかった。
- 参考スコア(独自算出の注目度): 62.12602920807109
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained classification often requires recognizing specific object parts,
such as beak shape and wing patterns for birds. Encouraging a fine-grained
classification model to first detect such parts and then using them to infer
the class could help us gauge whether the model is indeed looking at the right
details better than with interpretability methods that provide a single
attribution map. We propose PDiscoNet to discover object parts by using only
image-level class labels along with priors encouraging the parts to be:
discriminative, compact, distinct from each other, equivariant to rigid
transforms, and active in at least some of the images. In addition to using the
appropriate losses to encode these priors, we propose to use part-dropout,
where full part feature vectors are dropped at once to prevent a single part
from dominating in the classification, and part feature vector modulation,
which makes the information coming from each part distinct from the perspective
of the classifier. Our results on CUB, CelebA, and PartImageNet show that the
proposed method provides substantially better part discovery performance than
previous methods while not requiring any additional hyper-parameter tuning and
without penalizing the classification performance. The code is available at
https://github.com/robertdvdk/part_detection.
- Abstract(参考訳): 細粒度の分類は、しばしば、くちばしの形や鳥の翼のパターンなど、特定の対象部分を認識する必要がある。
粒度の細かい分類モデルを用いてまずそのような部分を検出し、クラスを推論することで、モデルが単一の属性マップを提供する解釈可能性メソッドよりも、正しい詳細を実際に見ているかどうかを判断することができる。
本稿では,画像レベルのクラスラベルのみを用いて対象部品の発見を行うPDiscoNetを提案する。
これらのプリエントを符号化するために適切な損失を使用するのに加えて、全部分特徴ベクトルを一度に落として分類において単一の部分が優位になるのを防ぐ部分ドロップアウトと、各部分から来る情報を分類器の視点から区別する部分特徴ベクトル変調を用いる。
CUB, CelebA, PartImageNet で行った結果から,提案手法は従来の手法よりもかなり優れた部分発見性能を提供するが, 追加のハイパーパラメータチューニングは必要とせず, 分類性能をペナルティ化しないことがわかった。
コードはhttps://github.com/robertdvdk/part_detectionで入手できる。
関連論文リスト
- Rethinking Person Re-identification from a Projection-on-Prototypes
Perspective [84.24742313520811]
検索タスクとしてのPerson Re-IDentification(Re-ID)は,過去10年間で大きな発展を遂げてきた。
本稿では,新しいベースライン ProNet を提案する。
4つのベンチマークの実験では、提案したProNetは単純だが有効であり、以前のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2023-08-21T13:38:10Z) - Unicom: Universal and Compact Representation Learning for Image
Retrieval [65.96296089560421]
大規模LAION400Mを,CLIPモデルにより抽出された共同テキストと視覚的特徴に基づいて,100万の擬似クラスにクラスタリングする。
このような矛盾を緩和するために、我々は、マージンベースのソフトマックス損失を構築するために、ランダムにクラス間の部分的なプロトタイプを選択する。
提案手法は,複数のベンチマークにおいて,教師なし,教師なしの画像検索手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-12T14:25:52Z) - Sanity checks and improvements for patch visualisation in
prototype-based image classification [0.0]
プロトタイプに基づく視覚分類のための2つの一般的な自己説明モデルに実装された視覚的手法の詳細な分析を行う。
まず、そのような手法は画像内の関心領域を正確に識別せず、従ってモデル動作を反映しないことを示す。
我々は,同じ可視化手法を共有する他のプロトタイプベースモデルに対して,本研究がもたらす意味について論じる。
論文 参考訳(メタデータ) (2023-01-20T15:13:04Z) - Interclass Prototype Relation for Few-Shot Segmentation [0.0]
少数ショットのセグメンテーションでは、特徴空間におけるターゲットクラスデータの分布は狭く、サンプルデータのわずかなばらつきのため、カバレッジが低い。
本研究は,他のクラス間の類似性を低減し,分離性能を向上するInterclass Prototype Relation Network (IPRNet)を提案する。
論文 参考訳(メタデータ) (2022-11-16T05:27:52Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - CAR: Class-aware Regularizations for Semantic Segmentation [20.947897583427192]
特徴学習におけるクラス内分散とクラス間距離を最適化するためのクラス認識正規化(CAR)手法を提案する。
本手法は,OCRやCPNetを含む既存のセグメンテーションモデルに容易に適用することができる。
論文 参考訳(メタデータ) (2022-03-14T15:02:48Z) - APANet: Adaptive Prototypes Alignment Network for Few-Shot Semantic
Segmentation [56.387647750094466]
Few-shotのセマンティックセマンティックセマンティクスは、指定されたクエリイメージに、ラベル付きサポートイメージのみで、新規クラスのオブジェクトをセグメントすることを目的としている。
ほとんどの高度なソリューションは、各クエリ機能を学習したクラス固有のプロトタイプにマッチさせることでセグメンテーションを実行するメトリクス学習フレームワークを利用している。
本稿では,クラス固有およびクラス非依存のプロトタイプを導入することで,適応型プロトタイプ表現を提案する。
論文 参考訳(メタデータ) (2021-11-24T04:38:37Z) - Unsupervised Part Discovery via Feature Alignment [15.67978793872039]
我々はニューラルネットワークの特徴がニュアンス変数にほとんど不変であるという特性を利用する。
対応する特徴写像のアフィンアライメントを通して、同じポーズで同じオブジェクトカテゴリのインスタンスを示す類似した画像のセットを見つける。
推論中は、部品検出はシンプルで高速で、フィードフォワードニューラルネットワーク以外の追加モジュールやオーバーヘッドは不要である。
論文 参考訳(メタデータ) (2020-12-01T07:25:00Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z) - End-to-end Learning of a Fisher Vector Encoding for Part Features in
Fine-grained Recognition [10.423464288613275]
部分的手法は局所的な特徴の欠如に悩まされていると仮定する。
本稿では、部分特徴のフィッシャーベクトル符号化を畳み込みニューラルネットワークに統合することを提案する。
本手法は3種の鳥種分類データセットにおける最先端の精度を向上させる。
論文 参考訳(メタデータ) (2020-07-04T12:17:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。