論文の概要: Morphable Detector for Object Detection on Demand
- arxiv url: http://arxiv.org/abs/2110.04917v1
- Date: Sun, 10 Oct 2021 22:29:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 11:14:12.546921
- Title: Morphable Detector for Object Detection on Demand
- Title(参考訳): オンデマンド物体検出用モルファス検出器
- Authors: Xiangyun Zhao, Xu Zou, Ying Wu
- Abstract要約: 少数のサンプルから推定される変化可能なパラメータのいくつかを単に「変形させる」新しい形態素検出器(MD)を提案する。
MDの学習は、機能埋め込みとプロトタイプをEMライクなアプローチで交互に学習することに基づいている。
我々は,Pascal,COCO,FSODデータセットにおけるMDの優位性を示した。
- 参考スコア(独自算出の注目度): 23.052757886831007
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many emerging applications of intelligent robots need to explore and
understand new environments, where it is desirable to detect objects of novel
classes on the fly with minimum online efforts. This is an object detection on
demand (ODOD) task. It is challenging, because it is impossible to annotate a
large number of data on the fly, and the embedded systems are usually unable to
perform back-propagation which is essential for training. Most existing
few-shot detection methods are confronted here as they need extra training. We
propose a novel morphable detector (MD), that simply "morphs" some of its
changeable parameters online estimated from the few samples, so as to detect
novel classes without any extra training. The MD has two sets of parameters,
one for the feature embedding and the other for class representation (called
"prototypes"). Each class is associated with a hidden prototype to be learned
by integrating the visual and semantic embeddings. The learning of the MD is
based on the alternate learning of the feature embedding and the prototypes in
an EM-like approach which allows the recovery of an unknown prototype from a
few samples of a novel class. Once an MD is learned, it is able to use a few
samples of a novel class to directly compute its prototype to fulfill the
online morphing process. We have shown the superiority of the MD in Pascal,
COCO and FSOD datasets. The code is available
https://github.com/Zhaoxiangyun/Morphable-Detector.
- Abstract(参考訳): インテリジェントロボットの新しい応用の多くは、新しい環境を探索し理解し、最小限のオンライン努力で新しいクラスのオブジェクトをその場で検出することが望ましい。
これは、オンデマンド(ODOD)タスクにおけるオブジェクト検出である。
大量のデータをオンザフライでアノテートすることは不可能であり、組み込みシステムは通常、トレーニングに不可欠なバックプロパゲーションを実行することができないため、難しい。
既存の少数ショット検出手法のほとんどは、追加のトレーニングを必要とするため、ここで対決される。
少数のサンプルから推定される変更可能なパラメータのいくつかをオンライン上で"モルフォロジー"して,新たなクラスをトレーニングなしで検出する,新たなモーフィナブル検出器(md)を提案する。
MDには2つのパラメータセットがあり、1つは特徴埋め込み用、もう1つはクラス表現用である("prototypes"と呼ばれる)。
各クラスは、ビジュアルとセマンティックの埋め込みを統合することで学習される隠れたプロトタイプに関連付けられている。
MDの学習は、新しいクラスのいくつかのサンプルから未知のプロトタイプを復元できるEMライクなアプローチで、機能の埋め込みとプロトタイプの交互に学習することに基づいている。
MDが学習されると、新しいクラスのいくつかのサンプルを使用して、そのプロトタイプを直接計算してオンラインモーフィングプロセスを満たすことができる。
我々は,Pascal,COCO,FSODデータセットにおけるMDの優位性を示した。
コードはhttps://github.com/zhaoxiangyun/morphable-detectorで入手できる。
関連論文リスト
- Online Learning via Memory: Retrieval-Augmented Detector Adaptation [7.391039875214243]
本稿では,任意の既製の物体検出モデルを,検出器モデルを再学習することなく,新しい領域に適応する方法を提案する。
人間が新しい主題(例えば記憶)の知識を素早く習得する方法(例えば記憶)にインスパイアされた私たちは、テスト期間中に、同様の物体の概念を記憶から探すことを可能にした。
論文 参考訳(メタデータ) (2024-09-16T20:40:26Z) - Open-Vocabulary Object Detection with Meta Prompt Representation and Instance Contrastive Optimization [63.66349334291372]
本稿ではメタプロンプトとインスタンスコントラスト学習(MIC)方式を用いたフレームワークを提案する。
まず、クラスとバックグラウンドのプロンプトを学習するプロンプトが新しいクラスに一般化するのを助けるために、新しいクラスエマージシナリオをシミュレートする。
第二に、クラス内コンパクト性とクラス間分離を促進するためのインスタンスレベルのコントラスト戦略を設計し、新しいクラスオブジェクトに対する検出器の一般化に寄与する。
論文 参考訳(メタデータ) (2024-03-14T14:25:10Z) - Scaling Novel Object Detection with Weakly Supervised Detection
Transformers [21.219817483091166]
Weakly Supervised Detection Transformerを提案する。これは大規模な事前学習データセットからWSODファインタニングへの効率的な知識伝達を可能にする。
提案手法は, 大規模オブジェクト検出データセットにおいて, 従来の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-07-11T21:45:54Z) - MINI: Mining Implicit Novel Instances for Few-Shot Object Detection [73.5061386065382]
Mining Implicit Novel Instances (MINI)は、暗黙の新規インスタンスを補助的なトレーニングサンプルとしてマイニングするための新しいフレームワークである。
MINIは、どのショットやスプリットでも、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-06T17:26:48Z) - Novel Applications for VAE-based Anomaly Detection Systems [5.065947993017157]
深層生成モデリング(DGM)は、与えられたデータセットから始まり、新規で見えないデータを生成することができる。
この技術が有望な応用を示すにつれて、多くの倫理的問題がもたらされる。
研究は、異なるバイアスが深層学習モデルに影響を与え、誤った表現のような社会的問題を引き起こすことを示している。
論文 参考訳(メタデータ) (2022-04-26T20:30:37Z) - Multi-Modal Few-Shot Object Detection with Meta-Learning-Based
Cross-Modal Prompting [77.69172089359606]
本稿では,マルチモーダルな複数ショットオブジェクト検出(FSOD)について,少数ショット視覚例とクラスセマンティック情報の両方を用いて検討する。
我々のアプローチは、(メトリックベース)メタラーニングとプロンプトベースラーニングの高レベルな概念的類似性によって動機付けられている。
提案するマルチモーダルFSODモデルを,複数の複数ショットオブジェクト検出ベンチマークで総合的に評価し,有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-16T16:45:06Z) - Adversarially Robust One-class Novelty Detection [83.1570537254877]
既存のノベルティ検出器は敵の例に感受性があることが示される。
本稿では, 新規性検知器の潜伏空間を制御し, 敵に対する堅牢性を向上する防衛戦略を提案する。
論文 参考訳(メタデータ) (2021-08-25T10:41:29Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z) - Incremental Few-Shot Object Detection [96.02543873402813]
OpeN-ended Centre nEtは、いくつかの例でクラスオブジェクトの検出を漸進的に学習する検出器である。
ONCEはインクリメンタルな学習パラダイムを十分に尊重しており、新しいクラス登録では、数発のトレーニングサンプルを1回だけフォワードパスするだけでよい。
論文 参考訳(メタデータ) (2020-03-10T12:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。