論文の概要: TARO: Toward Semantically Rich Open-World Object Detection
- arxiv url: http://arxiv.org/abs/2510.09173v1
- Date: Fri, 10 Oct 2025 09:15:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.588985
- Title: TARO: Toward Semantically Rich Open-World Object Detection
- Title(参考訳): TARO:Semantically Rich Open-World Object Detectionを目指して
- Authors: Yuchen Zhang, Yao Lu, Johannes Betz,
- Abstract要約: TAROは未知のオブジェクトを識別し、セマンティック階層内の粗い親カテゴリに分類する新しい検出フレームワークである。
TAROは,未知のクラスを29.9%まで有意な粗いクラスに分類し,未知のクラスと未知のクラスとの混同を著しく低減し,未知のリコールと既知のmAPの両方において競合性能を達成できることを示す。
- 参考スコア(独自算出の注目度): 9.59690330728612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern object detectors are largely confined to a "closed-world" assumption, limiting them to a predefined set of classes and posing risks when encountering novel objects in real-world scenarios. While open-set detection methods aim to address this by identifying such instances as 'Unknown', this is often insufficient. Rather than treating all unknowns as a single class, assigning them more descriptive subcategories can enhance decision-making in safety-critical contexts. For example, identifying an object as an 'Unknown Animal' (requiring an urgent stop) versus 'Unknown Debris' (requiring a safe lane change) is far more useful than just 'Unknown' in autonomous driving. To bridge this gap, we introduce TARO, a novel detection framework that not only identifies unknown objects but also classifies them into coarse parent categories within a semantic hierarchy. TARO employs a unique architecture with a sparsemax-based head for modeling objectness, a hierarchy-guided relabeling component that provides auxiliary supervision, and a classification module that learns hierarchical relationships. Experiments show TARO can categorize up to 29.9% of unknowns into meaningful coarse classes, significantly reduce confusion between unknown and known classes, and achieve competitive performance in both unknown recall and known mAP. Code will be made available.
- Abstract(参考訳): 現代の物体検出器は「クローズド・ワールド」の仮定に限られており、事前に定義されたクラスのセットに制限され、現実世界のシナリオで新しい物体に遭遇する際にリスクを生じさせる。
オープンセット検出手法は、そのようなインスタンスを"未知"と識別することで、この問題に対処することを目指しているが、多くの場合、これは不十分である。
すべての未知を単一のクラスとして扱うのではなく、より記述的なサブカテゴリを割り当てることで、安全クリティカルなコンテキストにおける意思決定を強化することができる。
例えば、物体を「未知の動物」(緊急停止が必要)と「未知のデブリ」(安全な車線変更が必要)と識別することは、単に「未知の動物」を自律運転に使用するよりもはるかに有用である。
このギャップを埋めるために,未知のオブジェクトを識別するだけでなく,意味階層内の粗い親カテゴリに分類する新たな検出フレームワークであるTAROを導入する。
TAROは、オブジェクトのモデリングにスパースマックスベースのヘッドを持つユニークなアーキテクチャ、補助的な監視を提供する階層誘導レザベリングコンポーネント、階層的な関係を学ぶ分類モジュールを採用している。
実験により、TAROは未知の最大29.9%を有意義な粗いクラスに分類でき、未知のクラスと既知のクラスとの混乱を著しく減らし、未知のリコールと既知のmAPの両方で競合性能を達成できることが示された。
コードは利用可能になる。
関連論文リスト
- O1O: Grouping of Known Classes to Identify Unknown Objects as Odd-One-Out [3.637162892228131]
現在のオブジェクト検出方法は、オブジェクトの候補位置に対応する擬似ラベルによる近似的な監視に依存している。
幾何的手がかりは未知のリコールを改善する。
超クラス内のクラス間の類似性を特定することで、奇数一点のスコアリング機構によって未知のクラスを識別できる。
論文 参考訳(メタデータ) (2024-10-10T01:08:04Z) - Hyp-OW: Exploiting Hierarchical Structure Learning with Hyperbolic
Distance Enhances Open World Object Detection [23.005760505169803]
オープンワールドオブジェクト検出は難しくて現実的なタスクです。
既知の物体と未知の物体の両方を検出する。
本稿では,既知の項目の階層的表現を学習し,モデル化するHyp-OWを提案する。
論文 参考訳(メタデータ) (2023-06-25T16:45:20Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.46204148650328]
全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。
U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。
MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文 参考訳(メタデータ) (2022-09-12T16:59:36Z) - Novel Class Discovery without Forgetting [72.52222295216062]
我々は NCDwF: Novel Class Discovery without Forgetting の新たな実用的問題設定を特定し,定式化する。
ラベルのないデータから新しいカテゴリのインスタンスを段階的に発見する機械学習モデルを提案する。
CIFAR-10, CIFAR-100, ImageNet-1000に基づく実験プロトコルを導入し, 知識保持と新しいクラス発見のトレードオフを測定する。
論文 参考訳(メタデータ) (2022-07-21T17:54:36Z) - Towards Open World Object Detection [68.79678648726416]
ORE: Open World Object Detectorは、対照的なクラスタリングとエネルギーベースの未知の識別に基づいている。
未知のインスタンスの識別と特徴付けは、インクリメンタルなオブジェクト検出設定における混乱を減らすのに役立ちます。
論文 参考訳(メタデータ) (2021-03-03T18:58:18Z) - Learning Open Set Network with Discriminative Reciprocal Points [70.28322390023546]
オープンセット認識は、事前に定義されたクラスからサンプルを同時に分類し、残りを「未知」として識別することを目的としている。
本稿では,各既知圏に対応するクラス外空間のポテンシャル表現であるReciprocal Pointを提案する。
相互点によって構成される有界空間に基づいて、未知のリスクは多圏相互作用によって減少する。
論文 参考訳(メタデータ) (2020-10-31T03:20:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。