論文の概要: Hyp2Former: Hierarchy-Aware Hyperbolic Embeddings for Open-Set Panoptic Segmentation
- arxiv url: http://arxiv.org/abs/2605.02580v1
- Date: Mon, 04 May 2026 13:33:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.302536
- Title: Hyp2Former: Hierarchy-Aware Hyperbolic Embeddings for Open-Set Panoptic Segmentation
- Title(参考訳): Hyp2Former: オープンセットパノプティブセグメンテーションのための階層型ハイパーボリック埋め込み
- Authors: Yao Lu, Rohit Mohan, Florian Drews, Yakov Miron, Abhinav Valada,
- Abstract要約: Open-Set Panoptic (OPS)は、未知のオブジェクトを独立したインスタンスとして識別しながら、既知のものやクラスを分割することを目的としている。
事前のアプローチは、既知のカテゴリをフラットなラベル集合として扱い、未知のオブジェクトと分布しないクラスを区別するための貴重な構造的事前情報を提供する意味的階層を無視している。
我々は,OPSのエンドツーエンドフレームワークであるHyp2Formerを提案する。
- 参考スコア(独自算出の注目度): 19.04466519384799
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognizing unknown objects is crucial for safety-critical applications such as autonomous driving and robotics. Open-Set Panoptic Segmentation (OPS) aims to segment known thing and stuff classes while identifying valid unknown objects as separate instances. Prior OPS approaches largely treat known categories as a flat label set, ignoring the semantic hierarchy that provides valuable structural priors for distinguishing unknown objects from in-distribution classes. In this work, we propose Hyp2Former, an end-to-end framework for OPS that does not require explicit modeling of unknowns during training, and instead learns hierarchical semantic similarities continuously in hyperbolic space. By explicitly encoding hierarchical relationships among known categories, the model learns a structured embedding space that captures multiple levels of semantic abstraction. As a result, unknown objects that cannot be confidently classified as known categories still remain in close proximity to higher-level concepts (e.g., an unknown animal remains closer to "animal" or "object" than to unrelated concepts such as "electronics" or "stuff") and can therefore be reliably detected, even if their fine-grained category was not represented during training. Empirical evaluations across multiple public datasets such as MS COCO, Cityscapes, and Lost&Found demonstrate that Hyp2Former outperforms existing methods on OPS, achieving the best balance between unknown object discovery and in-distribution robustness.
- Abstract(参考訳): 未知の物体を認識することは、自律運転やロボット工学といった安全上重要な応用に不可欠である。
Open-Set Panoptic Segmentation (OPS)は、未知のオブジェクトを独立したインスタンスとして識別しながら、既知のものやクラスを分割することを目的としている。
以前のOPSアプローチは、既知のカテゴリをフラットなラベル集合として扱うことが多く、未知のオブジェクトと分布しないクラスを区別するための貴重な構造的事前情報を提供するセマンティック階層を無視している。
本研究では,OPSのエンドツーエンドフレームワークであるHyp2Formerを提案する。
既知のカテゴリ間の階層的関係を明示的に符号化することにより、モデルは複数のレベルのセマンティック抽象化をキャプチャする構造化埋め込み空間を学習する。
結果として、既知のカテゴリーとして確実に分類できない未知の物体は、高いレベルの概念(例えば、未知の動物は「電子学」や「スタッフ」のような無関係な概念よりも「アニマル」や「オブジェクト」に近いままであり、訓練中にその微細なカテゴリーが表現されていなくても確実に検出できる。
MS COCO、Cityscapes、Lost&Foundといった複数の公開データセットに対する実証的な評価は、Hyp2FormerがOPSの既存のメソッドよりも優れており、未知のオブジェクト発見と分布内ロバストネスの最良のバランスを達成していることを示している。
関連論文リスト
- Language-Guided Open-World Anomaly Segmentation [81.13615952207685]
ClipomalyはCLIPをベースとした世界初のオープンワールドおよび異常セグメンテーション手法である。
ゼロショットアプローチでは、異常固有のトレーニングデータを必要とせず、未知のオブジェクトをセグメント化するためにCLIPの共有画像テキスト埋め込みスペースを活用する。
本モデルでは,推論時に語彙を動的に拡張し,クラス定義以外の異常の堅牢な検出と命名を可能にする。
論文 参考訳(メタデータ) (2025-12-01T09:08:59Z) - TARO: Toward Semantically Rich Open-World Object Detection [9.59690330728612]
TAROは未知のオブジェクトを識別し、セマンティック階層内の粗い親カテゴリに分類する新しい検出フレームワークである。
TAROは,未知のクラスを29.9%まで有意な粗いクラスに分類し,未知のクラスと未知のクラスとの混同を著しく低減し,未知のリコールと既知のmAPの両方において競合性能を達成できることを示す。
論文 参考訳(メタデータ) (2025-10-10T09:15:26Z) - SCOPE: Semantic Conditioning for Sim2Real Category-Level Object Pose Estimation in Robotics [8.467086312715892]
SCOPEは拡散に基づくカテゴリーレベルのオブジェクトポーズ推定モデルである。
DINOv2の機能を連続的なセマンティックプリエントとして活用することで、個別のカテゴリラベルの必要性を解消する。
5$5cmのメートル法で31.9%の相対的な改善を達成している。
論文 参考訳(メタデータ) (2025-09-29T10:27:59Z) - Prior2Former -- Evidential Modeling of Mask Transformers for Assumption-Free Open-World Panoptic Segmentation [74.55677741919035]
顕在学習に根ざしたセグメンテーション・ビジョン・トランスフォーマの最初のアプローチである Prefer2Former (P2F) を提案する。
P2Fは、ピクセル単位のバイナリマスク割り当てにおいて、モデル不確実性を計算するためのベータを組み込むことで、マスクビジョントランスフォーマーアーキテクチャを拡張している。
未知のクラスに対処するほとんどのセグメンテーションモデルとは異なり、P2FはOODデータサンプルへのアクセスや、ヴォイド(ラベルなし)クラスに対する対照的なトレーニングなしで動作する。
論文 参考訳(メタデータ) (2025-04-07T08:53:14Z) - Lidar Panoptic Segmentation in an Open World [50.094491113541046]
ライダーパノプティクス(LPS)は自動運転車の安全な配備に不可欠である。
LPSは、セマンティッククラスの事前に定義された語彙であるライダーポイントを認識し、セグメント化することを目的としている。
階層的な方法で入力クラウドのクラスタリングとオーバーセグメンテーションを提案し,次にバイナリポイントセグメント分類を行う。
論文 参考訳(メタデータ) (2024-09-22T00:10:20Z) - Hyp-OW: Exploiting Hierarchical Structure Learning with Hyperbolic
Distance Enhances Open World Object Detection [23.005760505169803]
オープンワールドオブジェクト検出は難しくて現実的なタスクです。
既知の物体と未知の物体の両方を検出する。
本稿では,既知の項目の階層的表現を学習し,モデル化するHyp-OWを提案する。
論文 参考訳(メタデータ) (2023-06-25T16:45:20Z) - Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.46204148650328]
全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。
U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。
MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文 参考訳(メタデータ) (2022-09-12T16:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。