論文の概要: Few-Shot Object Detection via Variational Feature Aggregation
- arxiv url: http://arxiv.org/abs/2301.13411v1
- Date: Tue, 31 Jan 2023 04:58:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 17:33:11.581739
- Title: Few-Shot Object Detection via Variational Feature Aggregation
- Title(参考訳): 変分特徴集合によるFew-Shotオブジェクト検出
- Authors: Jiaming Han, Yuqiang Ren, Jian Ding, Ke Yan, Gui-Song Xia
- Abstract要約: 本稿では,2つの新しい特徴集約方式を用いたメタラーニングフレームワークを提案する。
まず,クラス非依存アグリゲーション(CAA)手法を提案する。
次に、クラスレベルのサポート機能にサポート例をエンコードする変分特徴集約(VFA)手法を提案する。
- 参考スコア(独自算出の注目度): 32.34871873486389
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As few-shot object detectors are often trained with abundant base samples and
fine-tuned on few-shot novel examples,the learned models are usually biased to
base classes and sensitive to the variance of novel examples. To address this
issue, we propose a meta-learning framework with two novel feature aggregation
schemes. More precisely, we first present a Class-Agnostic Aggregation (CAA)
method, where the query and support features can be aggregated regardless of
their categories. The interactions between different classes encourage
class-agnostic representations and reduce confusion between base and novel
classes. Based on the CAA, we then propose a Variational Feature Aggregation
(VFA) method, which encodes support examples into class-level support features
for robust feature aggregation. We use a variational autoencoder to estimate
class distributions and sample variational features from distributions that are
more robust to the variance of support examples. Besides, we decouple
classification and regression tasks so that VFA is performed on the
classification branch without affecting object localization. Extensive
experiments on PASCAL VOC and COCO demonstrate that our method significantly
outperforms a strong baseline (up to 16\%) and previous state-of-the-art
methods (4\% in average). Code will be available at:
\url{https://github.com/csuhan/VFA}
- Abstract(参考訳): 少数ショットのオブジェクト検出器は、しばしば豊富なベースサンプルで訓練され、少数ショットの新規な例で微調整されるため、学習されたモデルは、通常、ベースクラスに偏り、新しいサンプルのばらつきに敏感である。
この問題に対処するために,我々は2つの新しい特徴集約スキームを持つメタラーニングフレームワークを提案する。
より正確には、まず、クエリとサポート機能をカテゴリに関係なく集約できるクラス非依存アグリゲーション(caa)メソッドを示します。
異なるクラス間の相互作用はクラスに依存しない表現を促進し、ベースクラスと新しいクラス間の混乱を減らす。
CAAをベースとして,ロバストな特徴集約のためのクラスレベルサポート機能にサポート例をエンコードする変分特徴集約(VFA)手法を提案する。
支援例の分散に対してより頑健な分布からクラス分布とサンプル変動特徴を推定するために変分オートエンコーダを用いる。
また,対象の局所化に影響を与えることなく,分類枝上でvfaを行うように分類タスクと回帰タスクを分離する。
PASCAL VOC および COCO の大規模実験により,本手法は強いベースライン (最大16 %) と過去の最先端手法 (平均4 %) を著しく上回っていることが示された。
コードは次の通り。 \url{https://github.com/csuhan/VFA}
関連論文リスト
- Semantic Enhanced Few-shot Object Detection [37.715912401900745]
本稿では, セマンティックな埋め込みを利用してより優れた検出を行う, 微調整に基づくFSODフレームワークを提案する。
提案手法は,各新規クラスが類似の基底クラスと混同されることなく,コンパクトな特徴空間を構築することを可能にする。
論文 参考訳(メタデータ) (2024-06-19T12:40:55Z) - Fine-Grained Prototypes Distillation for Few-Shot Object Detection [8.795211323408513]
Few-shot Object Detection (FSOD) は、新しい物体検出のためのジェネリック検出器を、少数の訓練例で拡張することを目的としている。
一般に、メタラーニングに基づく手法は、新しいサンプルをクラスプロトタイプにエンコードするために追加のサポートブランチを使用する。
より堅牢な新しいオブジェクト検出のために、特徴ある局所的コンテキストをキャプチャするためには、新しい方法が必要である。
論文 参考訳(メタデータ) (2024-01-15T12:12:48Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - PatchMix Augmentation to Identify Causal Features in Few-shot Learning [55.64873998196191]
少ないショット学習は、十分なカテゴリをラベル付けしたデータに基づいて学習した知識を、少ない既知の情報を持つ新しいカテゴリに転送することを目的としている。
我々はPatchMixと呼ばれる新しいデータ拡張戦略を提案し、この急激な依存関係を壊すことができる。
このような拡張メカニズムが,既存のメカニズムと異なり,因果的特徴を識別可能であることを示す。
論文 参考訳(メタデータ) (2022-11-29T08:41:29Z) - Class-Incremental Learning with Strong Pre-trained Models [97.84755144148535]
CIL(Class-incremental Learning)は、少数のクラス(ベースクラス)から始まる設定で広く研究されている。
我々は、多数のベースクラスで事前訓練された強力なモデルから始まるCILの実証済み実世界の設定について検討する。
提案手法は、解析されたCIL設定すべてに頑健で一般化されている。
論文 参考訳(メタデータ) (2022-04-07T17:58:07Z) - CAD: Co-Adapting Discriminative Features for Improved Few-Shot
Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。
最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。
本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T06:14:51Z) - Exploring Category-correlated Feature for Few-shot Image Classification [27.13708881431794]
本稿では,従来の知識として,新しいクラスとベースクラスのカテゴリ相関を探索し,シンプルで効果的な特徴補正手法を提案する。
提案手法は, 広く使用されている3つのベンチマークにおいて, 一定の性能向上が得られる。
論文 参考訳(メタデータ) (2021-12-14T08:25:24Z) - Few-Shot Object Detection via Association and DIscrimination [83.8472428718097]
AssociationとDIscriminationによるオブジェクト検出は、新しいクラスごとに2つのステップで識別可能な特徴空間を構築している。
Pascal VOCとMS-COCOデータセットの実験では、FADIは新しいSOTAパフォーマンスを実現し、ショット/スプリットのベースラインを+18.7で大幅に改善した。
論文 参考訳(メタデータ) (2021-11-23T05:04:06Z) - Revisiting Deep Local Descriptor for Improved Few-Shot Classification [56.74552164206737]
textbfDense textbfClassification と textbfAttentive textbfPooling を利用して埋め込みの質を向上させる方法を示す。
広範に使われているグローバル平均プール (GAP) の代わりに, 注意深いプールを施し, 特徴マップをプールすることを提案する。
論文 参考訳(メタデータ) (2021-03-30T00:48:28Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。