論文の概要: Language-Guided Open-World Anomaly Segmentation
- arxiv url: http://arxiv.org/abs/2512.01427v1
- Date: Mon, 01 Dec 2025 09:08:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.77224
- Title: Language-Guided Open-World Anomaly Segmentation
- Title(参考訳): 言語誘導型オープンワールド異常セグメンテーション
- Authors: Klara Reichard, Nikolas Brasch, Nassir Navab, Federico Tombari,
- Abstract要約: ClipomalyはCLIPをベースとした世界初のオープンワールドおよび異常セグメンテーション手法である。
ゼロショットアプローチでは、異常固有のトレーニングデータを必要とせず、未知のオブジェクトをセグメント化するためにCLIPの共有画像テキスト埋め込みスペースを活用する。
本モデルでは,推論時に語彙を動的に拡張し,クラス定義以外の異常の堅牢な検出と命名を可能にする。
- 参考スコア(独自算出の注目度): 81.13615952207685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-world and anomaly segmentation methods seek to enable autonomous driving systems to detect and segment both known and unknown objects in real-world scenes. However, existing methods do not assign semantically meaningful labels to unknown regions, and distinguishing and learning representations for unknown classes remains difficult. While open-vocabulary segmentation methods show promise in generalizing to novel classes, they require a fixed inference vocabulary and thus cannot be directly applied to anomaly segmentation where unknown classes are unconstrained. We propose Clipomaly, the first CLIP-based open-world and anomaly segmentation method for autonomous driving. Our zero-shot approach requires no anomaly-specific training data and leverages CLIP's shared image-text embedding space to both segment unknown objects and assign human-interpretable names to them. Unlike open-vocabulary methods, our model dynamically extends its vocabulary at inference time without retraining, enabling robust detection and naming of anomalies beyond common class definitions such as those in Cityscapes. Clipomaly achieves state-of-the-art performance on established anomaly segmentation benchmarks while providing interpretability and flexibility essential for practical deployment.
- Abstract(参考訳): オープンワールドと異常セグメンテーション手法は、自律運転システムが現実世界のシーンで既知の物体と未知の物体の両方を検出し、セグメンテーションできるようにする。
しかし,既存の手法では意味のあるラベルを未知の領域に割り当てることはできない。
オープンボキャブラリセグメンテーション法は、新しいクラスへの一般化の約束を示すが、それらは固定された推論ボキャブラリを必要とするため、未知のクラスが制約されないような異常セグメンテーションに直接適用することはできない。
ClipomalyはCLIPをベースとした世界初のオープンワールドおよび異常セグメンテーション手法である。
ゼロショットアプローチでは、異常固有のトレーニングデータは必要とせず、CLIPの共有画像テキスト埋め込みスペースを、両方の未知のオブジェクトに分割し、人間の解釈可能な名前に割り当てる。
オープン語彙法とは違って,我々のモデルは推論時に語彙を動的に拡張するので,Cityscapesなどの一般的なクラス定義を超えて,異常の堅牢な検出と命名が可能となる。
Clipomalyは、確立された異常セグメンテーションベンチマークの最先端のパフォーマンスを実現し、実用的なデプロイメントに不可欠な解釈性と柔軟性を提供する。
関連論文リスト
- A Novel Decomposed Feature-Oriented Framework for Open-Set Semantic Segmentation on LiDAR Data [6.427051055902494]
本稿では,LiDARデータのオープンセットセマンティックセマンティックセグメンテーションのための特徴指向フレームワークを提案する。
閉集合セマンティックセマンティックセグメンテーションを同時に実行し、未知のオブジェクトに特有の特徴を生成するために、デュアルデコーダネットワークを設計する。
近接したセマンティックセグメンテーションと異常検出の結果を統合することで、効率的な特徴駆動型LiDARオープンセットセマンティックセグメンテーションを実現する。
論文 参考訳(メタデータ) (2025-03-14T05:40:05Z) - From Open-Vocabulary to Vocabulary-Free Semantic Segmentation [78.62232202171919]
オープン語彙セマンティックセグメンテーションにより、モデルはトレーニングデータ以外の新しいオブジェクトカテゴリを識別できる。
現在のアプローチは依然として入力として手動で指定されたクラス名に依存しており、現実世界のアプリケーションに固有のボトルネックを生み出している。
この研究は、定義済みのクラス語彙を必要としない、語彙自由セマンティックパイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-17T15:17:08Z) - Lidar Panoptic Segmentation in an Open World [50.094491113541046]
ライダーパノプティクス(LPS)は自動運転車の安全な配備に不可欠である。
LPSは、セマンティッククラスの事前に定義された語彙であるライダーポイントを認識し、セグメント化することを目的としている。
階層的な方法で入力クラウドのクラスタリングとオーバーセグメンテーションを提案し,次にバイナリポイントセグメント分類を行う。
論文 参考訳(メタデータ) (2024-09-22T00:10:20Z) - Auto-Vocabulary Semantic Segmentation [13.410217680999462]
Open-Vocabulary (OVS) メソッドは、固定語彙に頼ることなくセマンティックセグメンテーションを実行できる。
本稿では,自動語彙セマンティック(AVS, Auto-Vocabulary Semantic)を提案する。
我々のアプローチであるAutoSegは、意味的に強化されたBLIP埋め込みを使用して関連するクラス名を自律的に識別し、その後セグメント化するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-07T18:55:52Z) - CLIP-DIY: CLIP Dense Inference Yields Open-Vocabulary Semantic
Segmentation For-Free [12.15899043709721]
CLIP-DIYと呼ばれるオープン語彙セマンティックセマンティックセマンティクス手法を提案する。
異なるサイズのパッチに対してCLIP分類機能を活用し、決定を単一のマップに集約する。
PASCAL VOCでは,最先端のゼロショットセマンティックセマンティックセマンティクスが得られ,COCOのベストメソッドと同等に動作する。
論文 参考訳(メタデータ) (2023-09-25T16:52:59Z) - Global Knowledge Calibration for Fast Open-Vocabulary Segmentation [124.74256749281625]
本稿では,各学習カテゴリの同義語群を生成するテキスト多様化戦略を提案する。
また,CLIPの汎用的な知識を維持するために,テキスト誘導型知識蒸留法を用いている。
提案手法は, 各種データセットに対して頑健な一般化性能を実現する。
論文 参考訳(メタデータ) (2023-03-16T09:51:41Z) - Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.46204148650328]
全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。
U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。
MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文 参考訳(メタデータ) (2022-09-12T16:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。