論文の概要: Sylph: A Hypernetwork Framework for Incremental Few-shot Object
Detection
- arxiv url: http://arxiv.org/abs/2203.13903v1
- Date: Fri, 25 Mar 2022 20:39:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 14:43:51.905017
- Title: Sylph: A Hypernetwork Framework for Incremental Few-shot Object
Detection
- Title(参考訳): sylph: インクリメンタルな少数ショットオブジェクト検出のためのハイパーネットワークフレームワーク
- Authors: Li Yin, Juan M Perez-Rua, Kevin J Liang
- Abstract要約: 大量のデータを含む多くの基本カテゴリがメタトレーニングに利用できる場合、ファネチューンフリーのiFSDは極めて有効であることを示す。
我々はCOCOとLVISの両方でモデルをベンチマークし、LVISの長テールレアクラスで最大17%のAPを報告した。
- 参考スコア(独自算出の注目度): 8.492340530784697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the challenging incremental few-shot object detection (iFSD)
setting. Recently, hypernetwork-based approaches have been studied in the
context of continuous and finetune-free iFSD with limited success. We take a
closer look at important design choices of such methods, leading to several key
improvements and resulting in a more accurate and flexible framework, which we
call Sylph. In particular, we demonstrate the effectiveness of decoupling
object classification from localization by leveraging a base detector that is
pretrained for class-agnostic localization on large-scale dataset. Contrary to
what previous results have suggested, we show that with a carefully designed
class-conditional hypernetwork, finetune-free iFSD can be highly effective,
especially when a large number of base categories with abundant data are
available for meta-training, almost approaching alternatives that undergo
test-time-training. This result is even more significant considering its many
practical advantages: (1) incrementally learning new classes in sequence
without additional training, (2) detecting both novel and seen classes in a
single pass, and (3) no forgetting of previously seen classes. We benchmark our
model on both COCO and LVIS, reporting as high as $17\%$ AP on the long-tail
rare classes on LVIS, indicating the promise of hypernetwork-based iFSD.
- Abstract(参考訳): ifsd(pregressal few-shot object detection)設定について検討した。
近年,超ネットワークベースの手法が,連続的かつ精細なifsdの文脈で研究され,成功を収めている。
このような手法の重要な設計選択について詳しく検討し、いくつかの重要な改善をもたらし、Sylphと呼ばれるより正確で柔軟なフレームワークを生み出しました。
特に,大規模データセット上のクラス非依存なローカライズのために事前学習されたベース検出器を活用して,対象の分類とローカライズを分離するの有効性を示す。
従来の結果とは対照的に,厳密に設計されたクラス条件のハイパーネットワークにより,大量のデータを持つ多数のベースカテゴリがメタトレーニングに利用可能である場合,特にテストタイムトレーニングを行う代替案に近づいた場合,ファネチューンフリーのiFSDは極めて有効であることを示す。
この結果は,(1)追加の訓練を伴わずに新しいクラスを逐次学習すること,(2)新しいクラスと見たクラスの両方を1回のパスで検出すること,(3)これまで見られたクラスを忘れないこと,といった多くの実践上の利点を考えると,さらに重要である。
我々は、COCOとLVISの両方でモデルをベンチマークし、LVISの長い尾のレアクラスで最大17\%$APを報告し、ハイパーネットワークベースのiFSDの可能性を示唆した。
関連論文リスト
- Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Incremental Few-Shot Object Detection via Simple Fine-Tuning Approach [6.808112517338073]
iFSDは、いくつかの例を使って、ベースクラスを再考することなく、新しいクラスを漸進的に学習する。
そこで本研究では,iFSDのための単純な微調整手法であるIncrmental Two-stage Fine-tuning Approach (iTFA)を提案する。
iTFAはCOCOの競争性能を達成し、LVISデータセットのメタラーニング手法よりも30%高いAP精度を示す。
論文 参考訳(メタデータ) (2023-02-20T05:48:46Z) - Fast Hierarchical Learning for Few-Shot Object Detection [57.024072600597464]
転送学習アプローチは、最近、数ショット検出タスクで有望な結果を得た。
これらのアプローチは、ベース検出器の微調整による破滅的な忘れ込みの問題に悩まされる。
この作業における上記の問題に対処する。
論文 参考訳(メタデータ) (2022-10-10T20:31:19Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - Towards Generalized and Incremental Few-Shot Object Detection [9.033533653482529]
新規なインクリメンタルFew-Shot Object Detection (iFSOD) 法を提案する。
具体的には、ベースクラスと新規クラスの特徴表現を分離するために、DBF(Double-Branch Framework)を提案する。
我々はPascal VOCとMS-COCOの両方で実験を行い、この手法がインクリメンタル・ショット検出の問題を効果的に解決できることを実証した。
論文 参考訳(メタデータ) (2021-09-23T12:38:09Z) - Fine-grained Angular Contrastive Learning with Coarse Labels [72.80126601230447]
教師付きおよび自己監督型コントラスト前訓練を効果的に組み合わせることができる新しい「Angularの正規化」モジュールを紹介します。
この研究は、C2FS分類のこの新しい、挑戦的で、非常に実用的なトピックに関する将来の研究の道を開くのに役立ちます。
論文 参考訳(メタデータ) (2020-12-07T08:09:02Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z) - Overcoming Classifier Imbalance for Long-tail Object Detection with
Balanced Group Softmax [88.11979569564427]
本報告では, 長期分布前における最先端モデルの過小評価に関する最初の体系的解析を行う。
本稿では,グループワイドトレーニングを通じて検出フレームワーク内の分類器のバランスをとるための,新しいバランス付きグループソフトマックス(BAGS)モジュールを提案する。
非常に最近の長尾大語彙オブジェクト認識ベンチマークLVISの大規模な実験により,提案したBAGSは検出器の性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2020-06-18T10:24:26Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。