論文の概要: Your "Flamingo" is My "Bird": Fine-Grained, or Not
- arxiv url: http://arxiv.org/abs/2011.09040v3
- Date: Sun, 28 Mar 2021 06:17:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 04:12:18.451947
- Title: Your "Flamingo" is My "Bird": Fine-Grained, or Not
- Title(参考訳): あなたの"Flamingo"は私の"Bird":ファイングラインドかノーか
- Authors: Dongliang Chang, Kaiyue Pang, Yixiao Zheng, Zhanyu Ma, Yi-Zhe Song,
and Jun Guo
- Abstract要約: 我々は,異なるレベルの専門知識の下で,様々なきめ細かい定義を調整する方法を検討する。
われわれはまず総合的な人間研究を行い、ほとんどの参加者が多粒度ラベルを好むことを確認した。
粗いレベルのラベル予測は、きめ細かい特徴学習をさらに高める。
- 参考スコア(独自算出の注目度): 60.25769809922673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Whether what you see in Figure 1 is a "flamingo" or a "bird", is the question
we ask in this paper. While fine-grained visual classification (FGVC) strives
to arrive at the former, for the majority of us non-experts just "bird" would
probably suffice. The real question is therefore -- how can we tailor for
different fine-grained definitions under divergent levels of expertise. For
that, we re-envisage the traditional setting of FGVC, from single-label
classification, to that of top-down traversal of a pre-defined coarse-to-fine
label hierarchy -- so that our answer becomes
"bird"-->"Phoenicopteriformes"-->"Phoenicopteridae"-->"flamingo". To approach
this new problem, we first conduct a comprehensive human study where we confirm
that most participants prefer multi-granularity labels, regardless whether they
consider themselves experts. We then discover the key intuition that:
coarse-level label prediction exacerbates fine-grained feature learning, yet
fine-level feature betters the learning of coarse-level classifier. This
discovery enables us to design a very simple albeit surprisingly effective
solution to our new problem, where we (i) leverage level-specific
classification heads to disentangle coarse-level features with fine-grained
ones, and (ii) allow finer-grained features to participate in coarser-grained
label predictions, which in turn helps with better disentanglement. Experiments
show that our method achieves superior performance in the new FGVC setting, and
performs better than state-of-the-art on traditional single-label FGVC problem
as well. Thanks to its simplicity, our method can be easily implemented on top
of any existing FGVC frameworks and is parameter-free.
- Abstract(参考訳): 図1で目にするものが"flamingo"なのか"bird"なのかは、この論文で私たちが問う疑問です。
きめ細かい視覚分類(FGVC)は前者への到達を試みていますが、ほとんどの場合、非専門家は「鳥」だけで十分でしょう。
それゆえ、本当の質問は -- 異なる専門知識のレベルの下で、どのように異なるきめ細かい定義を調整できるのか?
そのために、FGVCの従来の設定を、シングルラベルの分類から、事前に定義された粗いラベル階層のトップダウンのトラバーサルへと再検討し、私たちの答えが"bird"->"Phoenicopteriformes"->"Phoenicopteridae"->"flamingo"になるようにしました。
この新たな問題に取り組むために、まず、多くの参加者が専門家であるかどうかに関わらず、マルチグラニュラティラベルを好むことを確認するための、包括的な人間研究を行う。
粗いレベルのラベル予測は、きめ細かい特徴学習を悪化させるが、細い特徴は粗いレベルの分類器の学習をより良くする。
この発見によって私たちは、新しい問題に対して驚くほど効果的なソリューションを設計できます。
(i)粒度の細かい粗い特徴を乱すために、レベル固有の分類ヘッドを利用する。
(ii) よりきめ細かい特徴を粗いラベル予測に組み込むことにより, よりゆがみが良くなる。
実験により,本手法は新たなFGVC設定において優れた性能を示し,従来のシングルラベルFGVC問題よりも優れた性能を示した。
その単純さにより、既存のFGVCフレームワーク上で容易に実装でき、パラメータフリーである。
関連論文リスト
- Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Learning from Label Proportions: Bootstrapping Supervised Learners via Belief Propagation [18.57840057487926]
LLP(Learning from Label Proportions)は、トレーニング中にバッグと呼ばれるインスタンスのグループに対して、アグリゲートレベルのラベルしか利用できない学習問題である。
この設定は、プライバシー上の配慮から、広告や医療などの領域で発生する。
本稿では,この問題に対して,反復的に2つの主要なステップを実行する新しいアルゴリズムフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-12T06:09:26Z) - Shrinking Class Space for Enhanced Certainty in Semi-Supervised Learning [59.44422468242455]
そこで我々はShrinkMatchと呼ばれる新しい手法を提案し、不確実なサンプルを学習する。
それぞれの不確実なサンプルに対して、元の Top-1 クラスを単に含むスランク類空間を適応的に求める。
次に、スランク空間における強と弱に強化された2つのサンプル間の整合正則化を課し、識別的表現を試みます。
論文 参考訳(メタデータ) (2023-08-13T14:05:24Z) - Test-Time Amendment with a Coarse Classifier for Fine-Grained
Classification [10.719054378755981]
階層的アンサンブル(HiE)と呼ばれるポストホック補正のための新しいアプローチを提案する。
HiEはラベル階層を利用して、粗い粒度予測を用いてテスト時のきめ細かい分類の性能を向上させる。
提案手法は,細粒度クラスにおいてトレーニングデータが減少するにつれて,誤りの重大度が著しく低下する一方で,トップ1の精度において顕著な向上をもたらす。
論文 参考訳(メタデータ) (2023-02-01T10:55:27Z) - Pointly-Supervised Panoptic Segmentation [106.68888377104886]
弱教師付き単眼セグメンテーションにポイントレベルのアノテーションを適用するための新しい手法を提案する。
完全に教師された方法で使用される高密度のピクセルレベルラベルの代わりに、ポイントレベルラベルは、監督対象ごとに単一のポイントしか提供しない。
我々は、ポイントレベルのラベルから同時に汎視的擬似マスクを生成し、それらから学習することで、エンドツーエンドのフレームワークにおける問題を定式化する。
論文 参考訳(メタデータ) (2022-10-25T12:03:51Z) - Learning with an Evolving Class Ontology [82.89062737922869]
生涯学習者は時間とともに進化する概念を認識する必要がある。
あまり探索されていない一般的なシナリオは、古いクラスを洗練/拡張するラベルで学習することです。
論文 参考訳(メタデータ) (2022-10-10T19:58:23Z) - A Novel Plug-in Module for Fine-Grained Visual Classification [0.19336815376402716]
本稿では,多くの一般的なバックボーンと一体化して,強力な識別領域を提供する新しいプラグインモジュールを提案する。
実験の結果,提案するプラグインモジュールは最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2022-02-08T12:35:58Z) - Clue Me In: Semi-Supervised FGVC with Out-of-Distribution Data [44.90231337626545]
半教師付き視覚分類のための配布外データ処理に特化した新しい設計を提案する。
実験の結果, (i) 提案手法は分布外データに対して良好なロバスト性を示し, (ii) 先行技術を用いて, 性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-12-06T07:22:10Z) - Self-Supervised Learning from Semantically Imprecise Data [7.24935792316121]
動物」や「鳥」などの不正確なラベルから学ぶことは、熟練したラベル付きトレーニングデータが乏しい場合に重要な機能です。
CHILLAXはこの課題に取り組むために最近提案された方法です。
制約外挿を用いた自己教師型スキームでCHILLAXを拡張して擬似ラベルを生成する。
論文 参考訳(メタデータ) (2021-04-22T07:26:14Z) - Revisiting Deep Local Descriptor for Improved Few-Shot Classification [56.74552164206737]
textbfDense textbfClassification と textbfAttentive textbfPooling を利用して埋め込みの質を向上させる方法を示す。
広範に使われているグローバル平均プール (GAP) の代わりに, 注意深いプールを施し, 特徴マップをプールすることを提案する。
論文 参考訳(メタデータ) (2021-03-30T00:48:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。