論文の概要: One-Shot Unsupervised Cross-Domain Detection
- arxiv url: http://arxiv.org/abs/2005.11610v1
- Date: Sat, 23 May 2020 22:12:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:45:36.814301
- Title: One-Shot Unsupervised Cross-Domain Detection
- Title(参考訳): ワンショット教師なしクロスドメイン検出
- Authors: Antonio D'Innocente, Francesco Cappio Borlino, Silvia Bucci, Barbara
Caputo, Tatiana Tommasi
- Abstract要約: 本稿では,テスト時に見られる対象サンプルを1つだけ使用することにより,ドメイン間の非教師なし適応を実現できるオブジェクト検出アルゴリズムを提案する。
これを実現するために、単発で任意のサンプルに適応するマルチタスクアーキテクチャを導入し、その上で自己教師型タスクを反復的に解決する。
- 参考スコア(独自算出の注目度): 33.04327634746745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite impressive progress in object detection over the last years, it is
still an open challenge to reliably detect objects across visual domains.
Although the topic has attracted attention recently, current approaches all
rely on the ability to access a sizable amount of target data for use at
training time. This is a heavy assumption, as often it is not possible to
anticipate the domain where a detector will be used, nor to access it in
advance for data acquisition. Consider for instance the task of monitoring
image feeds from social media: as every image is created and uploaded by a
different user it belongs to a different target domain that is impossible to
foresee during training. This paper addresses this setting, presenting an
object detection algorithm able to perform unsupervised adaption across domains
by using only one target sample, seen at test time. We achieve this by
introducing a multi-task architecture that one-shot adapts to any incoming
sample by iteratively solving a self-supervised task on it. We further enhance
this auxiliary adaptation with cross-task pseudo-labeling. A thorough benchmark
analysis against the most recent cross-domain detection methods and a detailed
ablation study show the advantage of our method, which sets the
state-of-the-art in the defined one-shot scenario.
- Abstract(参考訳): ここ数年、オブジェクト検出の著しい進歩にもかかわらず、ビジュアルドメインをまたいだオブジェクトを確実に検出することは、まだ未解決の課題である。
このトピックは近年注目を集めているが、現在のアプローチはすべて、トレーニング時に使用する大量のターゲットデータにアクセスする能力に依存している。
これは重大な仮定であり、多くの場合、検出器が使用される領域を予測したり、データを取得する前にそれにアクセスすることは不可能である。
例えば、ソーシャルメディアから画像フィードを監視するタスクを考えてみてください。 異なるユーザによって画像が作成され、アップロードされるため、トレーニング中に予測できない別のターゲットドメインに属します。
本論文では,テスト時に見られる対象サンプルを1つだけ使用することにより,ドメイン間の非教師なし適応を可能にするオブジェクト検出アルゴリズムを提案する。
自己教師付きタスクを反復的に解いて,任意のサンプルにワンショットで適応するマルチタスクアーキテクチャを導入することで,これを実現する。
我々はこの補助適応をクロスタスク擬似ラベルによりさらに強化する。
最近のクロスドメイン検出法に対する詳細なベンチマーク解析と詳細なアブレーション研究は、定義されたワンショットシナリオの最先端を設定する方法の利点を示している。
関連論文リスト
- Feature Representation Learning for Unsupervised Cross-domain Image
Retrieval [73.3152060987961]
現在の教師付きクロスドメイン画像検索法は優れた性能が得られる。
データ収集とラベリングのコストは、実際のアプリケーションにおける実践的なデプロイにおいて、難易度の高い障壁を課します。
本稿では,クラス意味認識機能抽出を支援するために,クラスタ単位のコントラスト学習機構を提案する。
論文 参考訳(メタデータ) (2022-07-20T07:52:14Z) - Cross Domain Object Detection by Target-Perceived Dual Branch
Distillation [49.68119030818388]
クロスドメインオブジェクト検出は、現実的で挑戦的なタスクです。
本稿では,TDD(Target-perceived Dual-branch Distillation)フレームワークを提案する。
私たちのTDDは、すべてのベンチマークで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-05-03T03:51:32Z) - A Survey of Self-Supervised and Few-Shot Object Detection [19.647681501581225]
自己教師付き手法は、オブジェクト検出などの下流タスクにうまく転送されるラベルのないデータから表現を学習することを目的としている。
ほとんどショットされていないオブジェクト検出は、ほとんどデータを持たない新しい(見えない)オブジェクトクラスのモデルをトレーニングすることです。
本調査では, 少数ショット・自己監督型物体検出における最新のアプローチを概観し, 特徴付けする。
論文 参考訳(メタデータ) (2021-10-27T18:55:47Z) - One-Shot Object Affordance Detection in the Wild [76.46484684007706]
Affordance Detectionは、画像内のオブジェクトの潜在的なアクション可能性を特定することを指す。
我々は、人間の行動目的を推定し、それを転送して、すべての候補画像から共通価格を検出するワンショットアフォーダンス検出ネットワーク(OSAD-Net)を考案する。
複雑なシーンと豊富なアノテーションによって、当社のPADv2データセットは、アベイランス検出メソッドをベンチマークするためのテストベッドとして使用することができます。
論文 参考訳(メタデータ) (2021-08-08T14:53:10Z) - Self-Supervision & Meta-Learning for One-Shot Unsupervised Cross-Domain
Detection [0.0]
本研究では, 対象サンプルを1つだけ使用して, ドメイン間の教師なし適応を実現できるオブジェクト検出アルゴリズムを提案する。
メタラーニングを利用して、単サンプルのクロスドメイン学習エピソードをシミュレートし、テスト条件の整合性を向上する。
論文 参考訳(メタデータ) (2021-06-07T10:33:04Z) - Unsupervised Domain Adaption of Object Detectors: A Survey [87.08473838767235]
近年のディープラーニングの進歩は、様々なコンピュータビジョンアプリケーションのための正確で効率的なモデルの開発につながっている。
高度に正確なモデルを学ぶには、大量の注釈付きイメージを持つデータセットの可用性に依存する。
このため、ラベルスカースデータセットに視覚的に異なる画像がある場合、モデルの性能は大幅に低下する。
論文 参考訳(メタデータ) (2021-05-27T23:34:06Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Exploring Bottom-up and Top-down Cues with Attentive Learning for Webly
Supervised Object Detection [76.9756607002489]
本稿では,新しいクラスを対象としたWebSOD法を提案する。
提案手法はボトムアップとトップダウンを組み合わせた新しいクラス検出手法である。
提案手法は,3種類の新規/ベース分割を持つPASCAL VOCデータセット上で実証した。
論文 参考訳(メタデータ) (2020-03-22T03:11:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。