論文の概要: Hyp-OW: Exploiting Hierarchical Structure Learning with Hyperbolic
Distance Enhances Open World Object Detection
- arxiv url: http://arxiv.org/abs/2306.14291v2
- Date: Fri, 9 Feb 2024 21:07:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 00:44:06.939575
- Title: Hyp-OW: Exploiting Hierarchical Structure Learning with Hyperbolic
Distance Enhances Open World Object Detection
- Title(参考訳): Hyp-OW:ハイパーボリック距離を用いた階層構造学習の爆発によるオープンワールド物体検出
- Authors: Thang Doan, Xin Li, Sima Behpour, Wenbin He, Liang Gou, Liu Ren
- Abstract要約: オープンワールドオブジェクト検出は難しくて現実的なタスクです。
既知の物体と未知の物体の両方を検出する。
本稿では,既知の項目の階層的表現を学習し,モデル化するHyp-OWを提案する。
- 参考スコア(独自算出の注目度): 23.005760505169803
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open World Object Detection (OWOD) is a challenging and realistic task that
extends beyond the scope of standard Object Detection task. It involves
detecting both known and unknown objects while integrating learned knowledge
for future tasks. However, the level of "unknownness" varies significantly
depending on the context. For example, a tree is typically considered part of
the background in a self-driving scene, but it may be significant in a
household context. We argue that this contextual information should already be
embedded within the known classes. In other words, there should be a semantic
or latent structure relationship between the known and unknown items to be
discovered. Motivated by this observation, we propose Hyp-OW, a method that
learns and models hierarchical representation of known items through a
SuperClass Regularizer. Leveraging this representation allows us to effectively
detect unknown objects using a similarity distance-based relabeling module.
Extensive experiments on benchmark datasets demonstrate the effectiveness of
Hyp-OW, achieving improvement in both known and unknown detection (up to 6
percent). These findings are particularly pronounced in our newly designed
benchmark, where a strong hierarchical structure exists between known and
unknown objects. Our code can be found at
https://github.com/tldoan/-HYP-OW-AAAI-2024-
- Abstract(参考訳): open world object detection (owod)は、標準的なオブジェクト検出タスクの範囲を超えた、挑戦的で現実的なタスクである。
既知のオブジェクトと未知のオブジェクトの両方を検出し、将来のタスクのために学習知識を統合する。
しかし、「未知」のレベルは文脈によって大きく異なる。
例えば、木は一般的に、自動運転シーンの背景の一部と見なされるが、家庭の文脈では重要かもしれない。
このコンテキスト情報は、既に既知のクラスに埋め込まれるべきである。
言い換えれば、発見すべき既知の項目と未知の項目の間に、意味的あるいは潜在的な構造関係が存在するべきである。
そこで本研究では,SuperClass Regularizerを用いて既知の項目の階層的表現を学習し,モデル化するHyp-OWを提案する。
この表現を活用することで、類似度距離に基づくレザベリングモジュールを使用して、未知のオブジェクトを効果的に検出できる。
ベンチマークデータセットに関する広範な実験は、hyp-owの有効性を示し、既知の検出と未知検出の両方(最大6%)の改善を達成している。
これらの発見は、新しく設計されたベンチマークで特に顕著であり、既知のオブジェクトと未知のオブジェクトの間に強い階層構造が存在する。
私たちのコードはhttps://github.com/tldoan/-HYP-OW-AAAI-2024で確認できます。
関連論文リスト
- O1O: Grouping of Known Classes to Identify Unknown Objects as Odd-One-Out [3.637162892228131]
現在のオブジェクト検出方法は、オブジェクトの候補位置に対応する擬似ラベルによる近似的な監視に依存している。
幾何的手がかりは未知のリコールを改善する。
超クラス内のクラス間の類似性を特定することで、奇数一点のスコアリング機構によって未知のクラスを識別できる。
論文 参考訳(メタデータ) (2024-10-10T01:08:04Z) - Generative Region-Language Pretraining for Open-Ended Object Detection [55.42484781608621]
我々は,高密度物体を検出し,その名前を自由形式の方法で生成できるGenerateUというフレームワークを提案する。
本フレームワークはオープン語彙オブジェクト検出手法GLIPに匹敵する結果が得られる。
論文 参考訳(メタデータ) (2024-03-15T10:52:39Z) - Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Unsupervised Recognition of Unknown Objects for Open-World Object
Detection [28.787586991713535]
Open-World Object Detection (OWOD) はオブジェクト検出問題を現実的でダイナミックなシナリオに拡張する。
現在のOWODモデル(OREやOW-DETRなど)は、高い客観性スコアを持つ擬似ラベル領域に注目する。
本稿では,未知の物体を認識するために,教師なしの識別モデルを学ぶ新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-31T08:17:29Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Detecting the open-world objects with the help of the Brain [20.00772846521719]
Open World Object Detection (OWOD) は、新しいコンピュータビジョンタスクである。
OWODアルゴリズムは、目に見えない、未知のオブジェクトを検出し、それを漸進的に学習することが期待されている。
我々は、未知のラベルを単に生成することで、VLをオープンワールド検出器のBrain'として活用することを提案する。
論文 参考訳(メタデータ) (2023-03-21T06:44:02Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - More Practical Scenario of Open-set Object Detection: Open at Category
Level and Closed at Super-category Level [23.98839374194848]
オープンセットオブジェクト検出(OSOD)は近年注目されている。
我々はまず, 未知の物体の無限多様性を考慮した最近の研究で考慮されたOSODのシナリオが, 根本的な問題となっていることを指摘した。
この問題は未知のオブジェクト検出におけるメソッドの性能評価に困難をもたらす。
論文 参考訳(メタデータ) (2022-07-20T09:28:51Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - OW-DETR: Open-world Detection Transformer [90.56239673123804]
オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを提案する。
OW-DETRは3つの専用コンポーネント、すなわち注目駆動の擬似ラベル、新規性分類、オブジェクトネススコアから構成される。
我々のモデルは、最近導入されたOWODアプローチであるOREよりも優れており、リコールの度合いは1.8%から3.3%である。
論文 参考訳(メタデータ) (2021-12-02T18:58:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。