Fugu-MT 論文翻訳(概要): Enhancing Novel Object Detection via Cooperative Foundational Models

論文の概要: Enhancing Novel Object Detection via Cooperative Foundational Models

arxiv url: http://arxiv.org/abs/2311.12068v2
Date: Wed, 22 Nov 2023 04:13:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 12:05:59.732000
Title: Enhancing Novel Object Detection via Cooperative Foundational Models
Title（参考訳）: 協調基礎モデルによる新規物体検出の促進
Authors: Rohit Bharadwaj, Muzammal Naseer, Salman Khan, Fahad Shahbaz Khan
Abstract要約: 本稿では,既存のクローズドセット検出器をオープンセット検出器に変換する新しい手法を提案する。私たちは、新しいクラスに対して7.2$ textAP_50 のマージンで現在の最先端を越えています。
参考スコア（独自算出の注目度）: 75.30243629533277
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this work, we address the challenging and emergent problem of novel object detection (NOD), focusing on the accurate detection of both known and novel object categories during inference. Traditional object detection algorithms are inherently closed-set, limiting their capability to handle NOD. We present a novel approach to transform existing closed-set detectors into open-set detectors. This transformation is achieved by leveraging the complementary strengths of pre-trained foundational models, specifically CLIP and SAM, through our cooperative mechanism. Furthermore, by integrating this mechanism with state-of-the-art open-set detectors such as GDINO, we establish new benchmarks in object detection performance. Our method achieves 17.42 mAP in novel object detection and 42.08 mAP for known objects on the challenging LVIS dataset. Adapting our approach to the COCO OVD split, we surpass the current state-of-the-art by a margin of 7.2 $ \text{AP}_{50} $ for novel classes. Our code is available at https://github.com/rohit901/cooperative-foundational-models .
Abstract（参考訳）: 本稿では,新規物体検出(nod)の難解かつ創発的な問題に対処し,推論中の未知物体と新規物体のカテゴリの正確な検出に焦点をあてる。従来の物体検出アルゴリズムは本質的にクローズドセットであり、NODを扱う能力を制限する。本稿では,既存の閉集合検出器を開集合検出器に変換する新しい手法を提案する。この変換は、事前訓練された基礎モデル、特にCLIPとSAMの相補的な強みを協調的なメカニズムを通じて活用することで達成される。さらに,この機構をGDINOなどの最先端のオープンセット検出器と統合することにより,物体検出性能の新たなベンチマークを確立する。 LVISデータセット上の既知のオブジェクトに対して,新しいオブジェクト検出において17.42mAP,42.08mAPを達成する。 COCO OVDの分割にアプローチを適用すると、新しいクラスに対する7.2ドル \text{AP}_{50} のマージンで現在の最先端技術を上回っます。私たちのコードはhttps://github.com/rohit901/cooperative-foundational-modelsで利用可能です。

関連論文リスト

On the Inherent Robustness of One-Stage Object Detection against Out-of-Distribution Data [6.7236795813629]
画像データ中の未知物体を検出する新しい検出アルゴリズムを提案する。モデルによって抽出された特徴に対する次元の呪いの影響を軽減するために、教師付き次元削減技術を利用する。これは高解像度の特徴マップを用いて、教師なしの方法で潜在的に未知の物体を識別する。
論文参考訳（メタデータ） (2024-11-07T10:15:25Z)
Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文参考訳（メタデータ） (2024-11-04T12:59:13Z)
Open-World Object Detection with Instance Representation Learning [1.8749305679160366]
本研究では,新しい物体を検知し,オープンワールド条件下で意味的にリッチな特徴を抽出できる物体検知器の訓練手法を提案する。提案手法は頑健で一般化可能な特徴空間を学習し,他のOWODに基づく特徴抽出法よりも優れている。
論文参考訳（メタデータ） (2024-09-24T13:13:34Z)
DetToolChain: A New Prompting Paradigm to Unleash Detection Ability of MLLM [81.75988648572347]
DetToolChainはマルチモーダル大言語モデル(MLLM)のゼロショットオブジェクト検出能力を解き放つ新しいパラダイムである。提案手法は,高精度検出にヒントを得た検出プロンプトツールキットと,これらのプロンプトを実装するための新しいChain-of-Thoughtから構成される。 DetToolChainを用いたGPT-4Vは,オープン語彙検出のための新しいクラスセットにおいて,最先端のオブジェクト検出器を+21.5%AP50で改善することを示す。
論文参考訳（メタデータ） (2024-03-19T06:54:33Z)
Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文参考訳（メタデータ） (2024-02-05T15:25:32Z)
Open World Object Detection in the Era of Foundation Models [53.683963161370585]
5つの実世界のアプリケーション駆動データセットを含む新しいベンチマークを導入する。本稿では,オープンワールドのための新しいオブジェクト検出モデル(FOMO)を提案する。
論文参考訳（メタデータ） (2023-12-10T03:56:06Z)
Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。 CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文参考訳（メタデータ） (2023-08-18T13:13:09Z)
CAT: LoCalization and IdentificAtion Cascade Detection Transformer for Open-World Object Detection [17.766859354014663]
オープンワールドオブジェクト検出には、既知のオブジェクトと未知のオブジェクトの両方を検出するために、既知のオブジェクトのデータからトレーニングされたモデルが必要である。 CAT: LoCalization and IdentificAtion Cascade Detection Transformerを提案する。我々のモデルはOWOD, インクリメンタルオブジェクト検出(IOD), オープンセット検出といったタスクにおけるすべての指標において, 最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (2023-01-05T09:11:16Z)
Towards Open-Set Object Detection and Discovery [38.81806249664884]
我々は新しいタスク、すなわちOpen-Set Object Detection and Discovery(OSODD)を提案する。本稿では、まずオープンセットオブジェクト検出器を用いて、未知のオブジェクトと未知のオブジェクトの両方を予測する2段階の手法を提案する。そこで,予測対象を教師なしで表現し,未知対象の集合から新たなカテゴリを発見する。
論文参考訳（メタデータ） (2022-04-12T08:07:01Z)
Multi-View Correlation Distillation for Incremental Object Detection [12.536640582318949]
我々は,新しいtextbfMulti-textbfView textbfCorrelation textbfDistillation (MVCD) を用いたインクリメンタルオブジェクト検出法を提案する。
論文参考訳（メタデータ） (2021-07-05T04:36:33Z)
Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文参考訳（メタデータ） (2020-11-17T09:39:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。