論文の概要: Bidirectional Logits Tree: Pursuing Granularity Reconcilement in Fine-Grained Classification
- arxiv url: http://arxiv.org/abs/2412.12782v1
- Date: Tue, 17 Dec 2024 10:42:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 13:58:37.813876
- Title: Bidirectional Logits Tree: Pursuing Granularity Reconcilement in Fine-Grained Classification
- Title(参考訳): 双方向ロジットツリー:細粒度分類における粒度再構成
- Authors: Zhiguang Lu, Qianqian Xu, Shilong Bao, Zhiyong Yang, Qingming Huang,
- Abstract要約: 本稿では,粒度分類タスクにおけるグラニュラリティコンペティションの課題について述べる。
既存のアプローチは通常、共通のベースエンコーダから抽出された共有特徴に基づいて、独立した階層認識モデルを開発する。
グラニュラリティ再構成のための双方向ロジットツリー(BiLT)と呼ばれる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 89.20477310885731
- License:
- Abstract: This paper addresses the challenge of Granularity Competition in fine-grained classification tasks, which arises due to the semantic gap between multi-granularity labels. Existing approaches typically develop independent hierarchy-aware models based on shared features extracted from a common base encoder. However, because coarse-grained levels are inherently easier to learn than finer ones, the base encoder tends to prioritize coarse feature abstractions, which impedes the learning of fine-grained features. To overcome this challenge, we propose a novel framework called the Bidirectional Logits Tree (BiLT) for Granularity Reconcilement. The key idea is to develop classifiers sequentially from the finest to the coarsest granularities, rather than parallelly constructing a set of classifiers based on the same input features. In this setup, the outputs of finer-grained classifiers serve as inputs for coarser-grained ones, facilitating the flow of hierarchical semantic information across different granularities. On top of this, we further introduce an Adaptive Intra-Granularity Difference Learning (AIGDL) approach to uncover subtle semantic differences between classes within the same granularity. Extensive experiments demonstrate the effectiveness of our proposed method.
- Abstract(参考訳): 本稿では,多粒度ラベル間のセマンティックギャップに起因する粒度分類タスクにおける粒度競争の課題について論じる。
既存のアプローチは通常、共通のベースエンコーダから抽出された共有特徴に基づいて、独立した階層認識モデルを開発する。
しかし、粗粒度はより細かいものよりも本質的に学習しやすいため、基本エンコーダは粗粒度の特徴の抽象化を優先する傾向にあり、細粒度の特徴の学習を妨げる。
この課題を克服するために、グラニュラリティ再構成のための双方向ロジットツリー(BiLT)と呼ばれる新しいフレームワークを提案する。
鍵となる考え方は、同じ入力特徴に基づいた分類器の集合を並列に構築するのではなく、最も細かいものから粗い粒度まで連続的に分類器を開発することである。
この設定では、より粒度の細かい分類器の出力が粗粒度の入力として機能し、異なる粒度の階層的意味情報のフローを容易にする。
これに加えて、同じ粒度内のクラス間の微妙な意味的差異を明らかにするために、適応的粒内差分学習(AIGDL)アプローチも導入する。
実験の結果,提案手法の有効性が示された。
関連論文リスト
- Multi-Granularity Class Prototype Topology Distillation for Class-Incremental Source-Free Unsupervised Domain Adaptation [29.590172105562075]
クラスインクリメンタルソースフリーの非教師なしドメイン適応問題には2つの課題がある。
マルチグラニュラリティクラスプロトタイプトポロジー蒸留(GROTO)アルゴリズムを提案する。
提案手法は,3つの公開データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-11-25T03:28:09Z) - Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - OMH: Structured Sparsity via Optimally Matched Hierarchy for Unsupervised Semantic Segmentation [69.37484603556307]
Un Semantic segmenting (USS)は、事前に定義されたラベルに頼ることなく、イメージをセグメント化する。
上記の問題を同時に解決するために,OMH (Optimally Matched Hierarchy) という新しいアプローチを導入する。
我々のOMHは既存のUSS法と比較して教師なしセグメンテーション性能がよい。
論文 参考訳(メタデータ) (2024-03-11T09:46:41Z) - Relevant Intrinsic Feature Enhancement Network for Few-Shot Semantic
Segmentation [34.257289290796315]
本稿では,フォアグラウンドインスタンスのセマンティック一貫性を改善するために,RiFeNet(Relevant Intrinsic Feature Enhancement Network)を提案する。
RiFeNetはPASCAL-5iとCOCOベンチマークの最先端メソッドを上回っている。
論文 参考訳(メタデータ) (2023-12-11T16:02:57Z) - Hyperbolic Space with Hierarchical Margin Boosts Fine-Grained Learning
from Coarse Labels [43.3561344548331]
本稿では,視覚的埋め込みを双曲空間に埋め込み,その識別能力を階層的なコサインマージン方式で向上させる手法を提案する。
具体的には、双曲空間には、階層的関係を捉える能力を含む、明確な利点がある。
双曲空間に基づいて、我々はそれぞれ粗いクラスと細いクラスの間の相対的に大きな/小さな類似性マージンを強制し、いわゆる階層的コサインマージンの方法をもたらす。
論文 参考訳(メタデータ) (2023-11-18T09:42:03Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Towards Cross-Granularity Few-Shot Learning: Coarse-to-Fine
Pseudo-Labeling with Visual-Semantic Meta-Embedding [13.063136901934865]
少ないショットラーニングは、テスト時に少数のサンプルしか持たない、新しいカテゴリに迅速に適応することを目的としている。
本稿では,より困難なシナリオ,すなわちクロスグラニュラリティ・グラニュラリティ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラ
画像埋め込みの類似性に応じて,各粗いクラスを擬似微細クラスにグリーディクラスタリングすることで,詳細なデータ分布を近似する。
論文 参考訳(メタデータ) (2020-07-11T03:44:21Z) - Semi-Supervised Semantic Segmentation with Cross-Consistency Training [8.894935073145252]
セマンティックセグメンテーションのための新しいクロス一貫性に基づく半教師付きアプローチを提案する。
提案手法は,いくつかのデータセットにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2020-03-19T20:10:37Z) - Fine-Grained Visual Classification via Progressive Multi-Granularity
Training of Jigsaw Patches [67.51747235117]
きめ細かい視覚分類(FGVC)は従来の分類よりもはるかに難しい。
最近の研究は主に、最も差別的な部分の発見に焦点をあてることによってこの問題に対処している。
本稿では,これらの問題に対処するための視覚的細粒度分類のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-08T19:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。