論文の概要: Rethinking Few-Shot Object Detection on a Multi-Domain Benchmark
- arxiv url: http://arxiv.org/abs/2207.11169v1
- Date: Fri, 22 Jul 2022 16:13:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-25 13:21:27.317230
- Title: Rethinking Few-Shot Object Detection on a Multi-Domain Benchmark
- Title(参考訳): マルチドメインベンチマークによるFew-Shotオブジェクト検出の再検討
- Authors: Kibok Lee, Hao Yang, Satyaki Chakraborty, Zhaowei Cai, Gurumurthy
Swaminathan, Avinash Ravichandran, Onkar Dabeer
- Abstract要約: Multi-dOmain Few-Shot Object Detection (MoFSOD)ベンチマークは、幅広いドメインから10のデータセットで構成されている。
我々は、FSOD性能に対する凍結層、異なるアーキテクチャ、異なる事前学習データセットの影響を分析する。
- 参考スコア(独自算出の注目度): 28.818423712485504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing works on few-shot object detection (FSOD) focus on a setting
where both pre-training and few-shot learning datasets are from a similar
domain. However, few-shot algorithms are important in multiple domains; hence
evaluation needs to reflect the broad applications. We propose a Multi-dOmain
Few-Shot Object Detection (MoFSOD) benchmark consisting of 10 datasets from a
wide range of domains to evaluate FSOD algorithms. We comprehensively analyze
the impacts of freezing layers, different architectures, and different
pre-training datasets on FSOD performance. Our empirical results show several
key factors that have not been explored in previous works: 1) contrary to
previous belief, on a multi-domain benchmark, fine-tuning (FT) is a strong
baseline for FSOD, performing on par or better than the state-of-the-art (SOTA)
algorithms; 2) utilizing FT as the baseline allows us to explore multiple
architectures, and we found them to have a significant impact on down-stream
few-shot tasks, even with similar pre-training performances; 3) by decoupling
pre-training and few-shot learning, MoFSOD allows us to explore the impact of
different pre-training datasets, and the right choice can boost the performance
of the down-stream tasks significantly. Based on these findings, we list
possible avenues of investigation for improving FSOD performance and propose
two simple modifications to existing algorithms that lead to SOTA performance
on the MoFSOD benchmark. The code is available at
https://github.com/amazon-research/few-shot-object-detection-benchmark.
- Abstract(参考訳): 既存のほとんどの作業は、プレトレーニングとマイショット学習データセットが同じドメインのものであるような設定にフォーカスしている。
しかし、複数の領域で少数のショットアルゴリズムが重要であるため、評価は幅広い応用を反映する必要がある。
FSODアルゴリズムを評価するために,多領域から10個のデータセットからなるMulti-dOmain Few-Shot Object Detection (MoFSOD) ベンチマークを提案する。
FSOD性能に対する凍結層、異なるアーキテクチャ、異なる事前学習データセットの影響を包括的に分析する。
実験の結果、これまでの研究で検討されていないいくつかの重要な要因が示されました。
1) 従来の信念に反して,マルチドメインベンチマークでは,ファインチューニング(ft)は,fsodの強力なベースラインであり,最先端(sota)アルゴリズムと同等以上の性能を発揮する。
2) ft をベースラインとして利用することで,複数のアーキテクチャを探索することが可能になります。
3) 事前学習と数発の学習を分離することにより、MoFSODはさまざまな事前学習データセットの影響を探り、適切な選択によって下流タスクのパフォーマンスを大幅に向上させることができる。
これらの結果に基づき,fsod性能向上のための調査の道筋を列挙し,mofsodベンチマークでsota性能につながる既存のアルゴリズムの2つの簡単な修正を提案する。
コードはhttps://github.com/amazon-research/few-shot-object-detection-benchmarkで入手できる。
関連論文リスト
- Understanding the Cross-Domain Capabilities of Video-Based Few-Shot Action Recognition Models [3.072340427031969]
Few-shot Action Recognition (FSAR) は、ビデオ中の新しいアクションをわずかに例を使って識別できるモデルを学ぶことを目的としている。
メタトレーニング中に見られるベースデータセットと評価に使用される新しいデータセットは、異なるドメインから得ることができると仮定すると、クロスドメインの少数ショット学習によってデータ収集とアノテーションコストが軽減される。
我々は、新しいクロスドメインタスクに対して、既存の最先端の単一ドメイン、転送ベース、およびクロスドメインFSARメソッドを体系的に評価する。
論文 参考訳(メタデータ) (2024-06-03T07:48:18Z) - FaiMA: Feature-aware In-context Learning for Multi-domain Aspect-based
Sentiment Analysis [1.606149016749251]
マルチドメインアスペクトベースの感情分析(ABSA)は、多様なドメインにわたってきめ細かい感情を捉えようとしている。
マルチドメインABSA(FaiMA)のための特徴認識型インコンテキスト学習フレームワークを提案する。
FaiMAはマルチドメインABSAタスクの適応学習を容易にする機能認識機構である。
論文 参考訳(メタデータ) (2024-03-02T02:00:51Z) - BURST: A Benchmark for Unifying Object Recognition, Segmentation and
Tracking in Video [58.71785546245467]
複数の既存のベンチマークには、ビデオ内のオブジェクトのトラッキングとセグメンテーションが含まれる。
異なるベンチマークデータセットとメトリクスを使用するため、それらの相互作用はほとんどありません。
高品質なオブジェクトマスクを備えた数千の多様なビデオを含むデータセットであるBURSTを提案する。
すべてのタスクは、同じデータと同等のメトリクスを使って評価されます。
論文 参考訳(メタデータ) (2022-09-25T01:27:35Z) - Sylph: A Hypernetwork Framework for Incremental Few-shot Object
Detection [8.492340530784697]
大量のデータを含む多くの基本カテゴリがメタトレーニングに利用できる場合、ファネチューンフリーのiFSDは極めて有効であることを示す。
我々はCOCOとLVISの両方でモデルをベンチマークし、LVISの長テールレアクラスで最大17%のAPを報告した。
論文 参考訳(メタデータ) (2022-03-25T20:39:00Z) - Integrated Multiscale Domain Adaptive YOLO [5.33024001730262]
最近導入されたYOLOv4オブジェクト検出器の異なるスケールで、複数のドメイン適応パスと対応するドメイン分類器を利用する新しいMultiScale Domain Adaptive YOLO(MS-DAYOLO)フレームワークを導入する。
本実験は,提案したMS-DAYOLOアーキテクチャを用いたYOLOv4のトレーニングや,自動運転アプリケーションを対象とした目標データを用いたテストにおいて,オブジェクト検出性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-02-07T21:30:53Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Elastic Architecture Search for Diverse Tasks with Different Resources [87.23061200971912]
本研究では,異なるリソースを持つ多様なタスクを効率的に配置する上で,クラス群に対応するリソース制約や関心のタスクをテスト時に動的に指定する,新たな課題について検討する。
従来のNASアプローチでは、全てのクラスのアーキテクチャを同時に設計することを模索しており、これはいくつかの個別のタスクに最適ではないかもしれない。
本稿では、様々なリソース制約のある多様なタスクに対して、実行時に即時特殊化を可能にする、Elastic Architecture Search (EAS)と呼ばれる斬新で一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-03T00:54:27Z) - Real-Time Visual Object Tracking via Few-Shot Learning [107.39695680340877]
ビジュアルオブジェクト追跡(VOT)はFew-Shot Learning(FSL)の拡張タスクと見なすことができる。
適応速度を高速化しながら,多種多様のFSLアルゴリズムを適用可能な2段階のフレームワークを提案する。
VOT2018,OTB2015, NFS, UAV123, TrackingNet, GOT-10kの主要ベンチマークに関する実験を実施し,望ましいパフォーマンス向上とリアルタイム速度を示した。
論文 参考訳(メタデータ) (2021-03-18T10:02:03Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。