Fugu-MT 論文翻訳(概要): Lidar Panoptic Segmentation in an Open World

論文の概要: Lidar Panoptic Segmentation in an Open World

arxiv url: http://arxiv.org/abs/2409.14273v1
Date: Sun, 22 Sep 2024 00:10:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-06 23:26:16.304802
Title: Lidar Panoptic Segmentation in an Open World
Title（参考訳）: オープンワールドにおけるライダーパノプティクスのセグメンテーション
Authors: Anirudh S Chakravarthy, Meghana Reddy Ganesina, Peiyun Hu, Laura Leal-Taixe, Shu Kong, Deva Ramanan, Aljosa Osep,
Abstract要約: ライダーパノプティクス(LPS)は自動運転車の安全な配備に不可欠である。 LPSは、セマンティッククラスの事前に定義された語彙であるライダーポイントを認識し、セグメント化することを目的としている。階層的な方法で入力クラウドのクラスタリングとオーバーセグメンテーションを提案し,次にバイナリポイントセグメント分類を行う。
参考スコア（独自算出の注目度）: 50.094491113541046
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Addressing Lidar Panoptic Segmentation (LPS ) is crucial for safe deployment of autonomous vehicles. LPS aims to recognize and segment lidar points w.r.t. a pre-defined vocabulary of semantic classes, including thing classes of countable objects (e.g., pedestrians and vehicles) and stuff classes of amorphous regions (e.g., vegetation and road). Importantly, LPS requires segmenting individual thing instances (e.g., every single vehicle). Current LPS methods make an unrealistic assumption that the semantic class vocabulary is fixed in the real open world, but in fact, class ontologies usually evolve over time as robots encounter instances of novel classes that are considered to be unknowns w.r.t. the pre-defined class vocabulary. To address this unrealistic assumption, we study LPS in the Open World (LiPSOW): we train models on a dataset with a pre-defined semantic class vocabulary and study their generalization to a larger dataset where novel instances of thing and stuff classes can appear. This experimental setting leads to interesting conclusions. While prior art train class-specific instance segmentation methods and obtain state-of-the-art results on known classes, methods based on class-agnostic bottom-up grouping perform favorably on classes outside of the initial class vocabulary (i.e., unknown classes). Unfortunately, these methods do not perform on-par with fully data-driven methods on known classes. Our work suggests a middle ground: we perform class-agnostic point clustering and over-segment the input cloud in a hierarchical fashion, followed by binary point segment classification, akin to Region Proposal Network [1]. We obtain the final point cloud segmentation by computing a cut in the weighted hierarchical tree of point segments, independently of semantic classification. Remarkably, this unified approach leads to strong performance on both known and unknown classes.
Abstract（参考訳）: ライダー・パノプティクス・セグメンテーション(LPS)への対処は、自動運転車の安全な配備に不可欠である。 LPSは、可算オブジェクト(例えば歩行者や車両)のモノクラスや、非定型領域(例えば、植生や道路)のモノクラスを含む、セマンティッククラスの事前に定義された語彙を認識・セグメントすることを目的としている。重要なのは、LPSは個々のインスタンス(例えば、すべての車両)をセグメント化する必要があることだ。現在のLPS法は、意味クラス語彙が実際のオープンな世界で固定されているという非現実的な仮定をしているが、実際には、クラスオントロジは通常、事前に定義されたクラス語彙のように未知であると考えられる新しいクラスのインスタンスに遭遇するにつれて、時間とともに進化する。この非現実的な仮定に対処するため、我々はOpen World (LiPSOW): 定義済みのセマンティッククラスボキャブラリを持つデータセット上でモデルをトレーニングし、それらの一般化を、モノやモノの新たなインスタンスが現れるような大きなデータセットに研究する。この実験的な設定は興味深い結論をもたらす。先行技術訓練では、クラス固有のインスタンスセグメンテーション法と、既知のクラスにおける最先端の結果を得るが、クラスに依存しないボトムアップグルーピング法は、初期クラス語彙以外のクラス(すなわち未知クラス)で好意的に機能する。残念ながら、これらのメソッドは、既知のクラスで完全にデータ駆動のメソッドと同等に動作しない。分類に依存しない点クラスタリングを行い、階層的な方法で入力クラウドを過剰に分離し、次に領域提案ネットワークのようにバイナリポイントセグメントの分類を行う。我々は、意味分類とは独立に、点セグメントの重み付き階層木におけるカットを計算することで、最終点雲のセグメンテーションを得る。注目すべきは、この統一されたアプローチは、既知のクラスと未知のクラスの両方で強力なパフォーマンスをもたらすことだ。

関連論文リスト

Language-Guided Open-World Anomaly Segmentation [81.13615952207685]
ClipomalyはCLIPをベースとした世界初のオープンワールドおよび異常セグメンテーション手法である。ゼロショットアプローチでは、異常固有のトレーニングデータを必要とせず、未知のオブジェクトをセグメント化するためにCLIPの共有画像テキスト埋め込みスペースを活用する。本モデルでは,推論時に語彙を動的に拡張し,クラス定義以外の異常の堅牢な検出と命名を可能にする。
論文参考訳（メタデータ） (2025-12-01T09:08:59Z)
LangHOPS: Language Grounded Hierarchical Open-Vocabulary Part Segmentation [56.12844551763724]
オープンな語彙を持つオブジェクト-部分のインスタンスセグメンテーションのための,MLLM(Multimodal Large Language Model)ベースのフレームワークであるLangHOPSを提案する。 LangHOPSは、オープン語彙候補カテゴリから階層オブジェクトと部分インスタンスを共同で検出し、セグメント化することができる。
論文参考訳（メタデータ） (2025-10-29T08:21:59Z)
Clustering is back: Reaching state-of-the-art LiDAR instance segmentation without training [69.2787246878521]
本研究は, セマンティックラベルのみを用いて, 競合するパノプティクスのセグメンテーションを実現できることを示す。本手法は完全に説明可能であり,学習やパラメータチューニングは不要である。
論文参考訳（メタデータ） (2025-03-17T14:12:08Z)
Training-Free Semantic Segmentation via LLM-Supervision [37.9007813884699]
本稿では,大規模言語モデル(LLM)を用いたテキスト教師付きセマンティックセマンティックセマンティクスの新しいアプローチを提案する。我々のメソッドは LLM から始まり、より正確なクラス表現のための詳細なサブクラスのセットを生成する。次に、テキスト教師付きセマンティックセマンティックセマンティクスモデルを用いて、生成されたサブクラスをターゲットラベルとして適用する。
論文参考訳（メタデータ） (2024-03-31T14:37:25Z)
Enhancing Visual Continual Learning with Language-Guided Supervision [76.38481740848434]
継続的な学習は、モデルが以前獲得した知識を忘れずに新しいタスクを学習できるようにすることを目的としている。ワンホットラベルが伝達する少ない意味情報は,タスク間の効果的な知識伝達を妨げている,と我々は主張する。具体的には, PLM を用いて各クラスのセマンティックターゲットを生成し, 凍結し, 監視信号として機能する。
論文参考訳（メタデータ） (2024-03-24T12:41:58Z)
Auto-Vocabulary Semantic Segmentation [13.410217680999462]
textitAuto-Vocabulary Semantics (AVS)を導入する。本フレームワークは,拡張BLIP埋め込みを用いて,関連クラス名を自律的に識別する。提案手法は,PASCAL VOCやContext,ADE20K,Cityscapes for AVSなどのデータセットに新たなベンチマークを設定する。
論文参考訳（メタデータ） (2023-12-07T18:55:52Z)
Towards Realistic Zero-Shot Classification via Self Structural Semantic Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文参考訳（メタデータ） (2023-08-24T17:56:46Z)
LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文参考訳（メタデータ） (2022-10-14T19:13:36Z)
DocSCAN: Unsupervised Text Classification via Learning from Neighbors [2.2082422928825145]
Semantic Clustering by Adopting Nearest-Neighbors (SCAN)を用いた、完全に教師なしのテキスト分類アプローチであるDocSCANを紹介します。各文書に対して,大規模事前学習言語モデルから意味情報ベクトルを得る。類似の文書には近接ベクトルがあるので、表現空間の隣人はトピックラベルを共有する傾向がある。学習可能なクラスタリングアプローチでは、隣接するデータポイントのペアを弱い学習信号として使用します。提案されたアプローチは、グラウンドトラスラベルなしでデータセット全体にクラスを割り当てることを学ぶ。
論文参考訳（メタデータ） (2021-05-09T21:20:31Z)
Video Class Agnostic Segmentation Benchmark for Autonomous Driving [13.312978643938202]
特定の安全クリティカルなロボティクスアプリケーションでは、トレーニング時に未知のものを含むすべてのオブジェクトを分割することが重要です。自律運転における単眼ビデオシーケンスから未知の物体を考慮に入れたビデオクラスセグメンテーションのタスクを定式化する。
論文参考訳（メタデータ） (2021-03-19T20:41:40Z)
LRGNet: Learnable Region Growing for Class-Agnostic Point Cloud Segmentation [19.915593390338337]
本研究は,クラス非依存のクラウドセグメンテーションのための学習可能な領域成長手法を提案する。提案手法は, 物体の形状や大きさを仮定することなく, 単一の深層ニューラルネットワークを用いて任意のクラスを分割することができる。
論文参考訳（メタデータ） (2021-03-16T15:58:01Z)
Isometric Propagation Network for Generalized Zero-shot Learning [72.02404519815663]
一般的な戦略は、クラス属性の意味空間と、見たクラスとそのデータに基づいて画像の視覚空間とのマッピングを学ぶことである。本稿では,各空間内のクラス間の関係を強化し,2つの空間におけるクラス依存性を整合させるIsometric propagation Network (IPN)を提案する。 IPNは3つの人気のあるゼロショット学習ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2021-02-03T12:45:38Z)
Attribute Propagation Network for Graph Zero-shot Learning [57.68486382473194]
属性伝達ネットワーク (APNet) を導入し, 1) クラス毎に属性ベクトルを生成するグラフ伝搬モデルと, 2) パラメータ化隣人 (NN) 分類器から構成する。 APNetは、2つのゼロショット学習設定と5つのベンチマークデータセットによる実験で、魅力的なパフォーマンスまたは新しい最先端の結果を達成する。
論文参考訳（メタデータ） (2020-09-24T16:53:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。