論文の概要: CD-FSOD: A Benchmark for Cross-domain Few-shot Object Detection
- arxiv url: http://arxiv.org/abs/2210.05311v1
- Date: Tue, 11 Oct 2022 10:10:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 16:10:53.642896
- Title: CD-FSOD: A Benchmark for Cross-domain Few-shot Object Detection
- Title(参考訳): CD-FSOD:クロスドメインFew-shotオブジェクト検出のためのベンチマーク
- Authors: Wuti Xiong and Li Liu
- Abstract要約: そこで本研究では,CD-FSODベンチマークを新たに提案する。
我々は、最先端FSODアプローチを評価し、検出モデルと事前学習データセットがパフォーマンスに与える影響を分析する。
提案手法は,既存の手法に比べて,提案したベンチマークのマージンを大きく上回っている。
- 参考スコア(独自算出の注目度): 7.773772558834361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although few-shot object detection (FSOD) has attracted great research
attention, no work yet exists that studies FSOD across the different domains
seen in real-world scenarios. In this paper, we propose a new study of the
cross-domain few-shot object detection (CD-FSOD) benchmark, consisting of image
data from a diverse data domain. On the proposed benchmark, we evaluate
state-of-art FSOD approaches, and analyze the impact of detection models and
pre-training datasets on performance. The results reveal several key findings:
(1) the existing FSOD approaches tend to fall, and even underperform the naive
fine-tuning model; 2) the pre-training datasets and detection architectures
play an important role, and the right choice can boost the performance of the
target tasks significantly. Besides, we also analyze the reasons for existing
FSOD approaches' failure, and introduce a strong baseline that uses a
mutually-beneficial manner to alleviate the overfitting problem. Our approach
is remarkably superior to existing approaches by significant margins (\%2.3 on
average) on the proposed benchmark and also achieves competitive performance on
the FSOD benchmark.
- Abstract(参考訳): 少数ショット物体検出(fsod)は研究の注目を集めているが、実世界のシナリオで見られる異なる領域でfsodを研究する研究はまだ存在しない。
本稿では,多種多様なデータ領域の画像データからなるクロスドメイン小ショットオブジェクト検出(CD-FSOD)ベンチマークを提案する。
提案するベンチマークでは,最先端のfsod手法を評価し,検出モデルとデータセットがパフォーマンスに与える影響を分析した。
その結果,(1)既存のfsodアプローチは低下傾向にあり,また,naive fine-tuning modelを過小評価する傾向がみられた。
2) 事前学習したデータセットと検出アーキテクチャは重要な役割を担い,適切な選択によって目標タスクのパフォーマンスを大幅に向上させることができる。
さらに,既存のFSODアプローチの失敗の原因を解析し,オーバーフィッティング問題を緩和するために相互便宜的手法を用いた強力なベースラインを導入する。
提案手法は,提案ベンチマークにおいて有意なマージン(平均2.3%)で既存手法よりも優れており,また,fsodベンチマークでの競合性能も達成している。
関連論文リスト
- Understanding the Cross-Domain Capabilities of Video-Based Few-Shot Action Recognition Models [3.072340427031969]
Few-shot Action Recognition (FSAR) は、ビデオ中の新しいアクションをわずかに例を使って識別できるモデルを学ぶことを目的としている。
メタトレーニング中に見られるベースデータセットと評価に使用される新しいデータセットは、異なるドメインから得ることができると仮定すると、クロスドメインの少数ショット学習によってデータ収集とアノテーションコストが軽減される。
我々は、新しいクロスドメインタスクに対して、既存の最先端の単一ドメイン、転送ベース、およびクロスドメインFSARメソッドを体系的に評価する。
論文 参考訳(メタデータ) (2024-06-03T07:48:18Z) - Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - Dense Affinity Matching for Few-Shot Segmentation [83.65203917246745]
Few-Shot (FSS) は、新しいクラスイメージをいくつかのサンプルで分割することを目的としている。
本稿では,サポートクエリ間の相互作用を生かした密接な親和性マッチングフレームワークを提案する。
我々のフレームワークは0.68万のパラメータしか持たない異なる設定で非常に競争力のある性能を示す。
論文 参考訳(メタデータ) (2023-07-17T12:27:15Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - A Simple Information-Based Approach to Unsupervised Domain-Adaptive
Aspect-Based Sentiment Analysis [58.124424775536326]
本稿では,相互情報に基づくシンプルだが効果的な手法を提案し,それらの用語を抽出する。
実験の結果,提案手法はクロスドメインABSAの最先端手法よりも4.32%高い性能を示した。
論文 参考訳(メタデータ) (2022-01-29T10:18:07Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - An Enhanced Span-based Decomposition Method for Few-Shot Sequence
Labeling [27.468499201647063]
FSSL(Few-Shot Sequence Labeling)は、タグ付けモデルが新たなリソース共有ドメインを一般化するための標準的なソリューションである。
本稿では,FSSLのメトリックベースメタラーニングパラダイムに従う拡張Spanベースの解法を提案する。
論文 参考訳(メタデータ) (2021-09-27T12:59:48Z) - SimROD: A Simple Adaptation Method for Robust Object Detection [8.307942341807152]
本稿では、ロバスト物体検出(SimROD)のための単純で効果的な教師なし適応法を提案する。
本手法は,新たなドメイン中心の強化手法,段階的な自己ラベル適応手順,教師が指導する微調整機構を統合する。
画像の破損や高レベルのクロスドメイン適応ベンチマークに適用した場合,提案手法は従来のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2021-07-28T14:28:32Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。