論文の概要: GOOD: Exploring Geometric Cues for Detecting Objects in an Open World
- arxiv url: http://arxiv.org/abs/2212.11720v1
- Date: Thu, 22 Dec 2022 14:13:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 14:11:20.012601
- Title: GOOD: Exploring Geometric Cues for Detecting Objects in an Open World
- Title(参考訳): オープン世界における物体検出のための幾何学的手がかりを探る
- Authors: Haiwen Huang, Andreas Geiger, Dan Zhang
- Abstract要約: 最先端のRGBベースのモデルは、トレーニングクラスの過度な適合に悩まされ、新しいオブジェクトの検出に失敗することが多い。
汎用単分子推定器により予測される深度や正規度などの幾何学的手法を取り入れることを提案する。
我々のGeometry-Guided Open World Object Detector (GOOD)は、新しいオブジェクトカテゴリの検出リコールを大幅に改善し、いくつかのトレーニングクラスですでにうまく機能している。
- 参考スコア(独自算出の注目度): 33.25263418112558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the task of open-world class-agnostic object detection, i.e.,
detecting every object in an image by learning from a limited number of base
object classes. State-of-the-art RGB-based models suffer from overfitting the
training classes and often fail at detecting novel-looking objects. This is
because RGB-based models primarily rely on appearance similarity to detect
novel objects and are also prone to overfitting short-cut cues such as textures
and discriminative parts. To address these shortcomings of RGB-based object
detectors, we propose incorporating geometric cues such as depth and normals,
predicted by general-purpose monocular estimators. Specifically, we use the
geometric cues to train an object proposal network for pseudo-labeling
unannotated novel objects in the training set. Our resulting Geometry-guided
Open-world Object Detector (GOOD) significantly improves detection recall for
novel object categories and already performs well with only a few training
classes. Using a single "person" class for training on the COCO dataset, GOOD
surpasses SOTA methods by 5.0% AR@100, a relative improvement of 24%.
- Abstract(参考訳): オープンワールドのクラスに依存しないオブジェクト検出,すなわち,少数のベースオブジェクトクラスから学習することで,画像中のすべてのオブジェクトを検出するタスクに対処する。
最先端のRGBベースのモデルは、トレーニングクラスの過度な適合に悩まされ、新しいオブジェクトの検出に失敗することが多い。
これは、rgbベースのモデルは、主に新しい物体を検出するために外観の類似性に依存しており、テクスチャや判別部品のような短いキューを過度に当てはまる傾向があるためである。
rgbベースの物体検出器の欠点に対処するために,汎用単眼推定器によって予測される深さや正規値などの幾何学的手がかりを組み込んだ手法を提案する。
具体的には、幾何学的手がかりを用いて、トレーニングセット内の未注釈の新規オブジェクトを擬似ラベル付けするオブジェクト提案ネットワークをトレーニングする。
我々のGeometry-Guided Open World Object Detector (GOOD)は、新しいオブジェクトカテゴリの検出リコールを大幅に改善し、いくつかのトレーニングクラスですでにうまく機能している。
COCOデータセットのトレーニングに1つの"人"クラスを使用して、GOODはSOTAメソッドを5.0%のAR@100で上回り、相対的な改善は24%である。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Identification of Novel Classes for Improving Few-Shot Object Detection [12.013345715187285]
Few-shot Object Detection (FSOD) メソッドは、クラス毎に少数のトレーニングサンプルのみを使用して、堅牢なオブジェクト検出を実現することで、改善を提供する。
我々は、FSOD性能を向上させるためのトレーニング中に、未ラベルの新規物体を正のサンプルとして検出し、利用するための半教師付きアルゴリズムを開発した。
実験の結果,本手法は既存のSOTA FSOD法よりも有効であり,優れた結果が得られた。
論文 参考訳(メタデータ) (2023-03-18T14:12:52Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - Spatial Reasoning for Few-Shot Object Detection [21.3564383157159]
本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
論文 参考訳(メタデータ) (2022-11-02T12:38:08Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。