論文の概要: Scene-Centric Unsupervised Panoptic Segmentation
- arxiv url: http://arxiv.org/abs/2504.01955v1
- Date: Wed, 02 Apr 2025 17:58:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:21:10.537794
- Title: Scene-Centric Unsupervised Panoptic Segmentation
- Title(参考訳): Scene-Centric Unsupervised Panoptic Segmentation
- Authors: Oliver Hahn, Christoph Reich, Nikita Araslanov, Daniel Cremers, Christian Rupprecht, Stefan Roth,
- Abstract要約: 教師なしのパノプティックセグメンテーションは、手動でアノテートされたデータをトレーニングすることなく、イメージを意味のある領域と異なるオブジェクトインスタンスに分割することを目的としている。
シーン中心の画像を直接トレーニングする、教師なしの初めてのパン光学的手法を提案する。
- 参考スコア(独自算出の注目度): 56.253072379456356
- License:
- Abstract: Unsupervised panoptic segmentation aims to partition an image into semantically meaningful regions and distinct object instances without training on manually annotated data. In contrast to prior work on unsupervised panoptic scene understanding, we eliminate the need for object-centric training data, enabling the unsupervised understanding of complex scenes. To that end, we present the first unsupervised panoptic method that directly trains on scene-centric imagery. In particular, we propose an approach to obtain high-resolution panoptic pseudo labels on complex scene-centric data, combining visual representations, depth, and motion cues. Utilizing both pseudo-label training and a panoptic self-training strategy yields a novel approach that accurately predicts panoptic segmentation of complex scenes without requiring any human annotations. Our approach significantly improves panoptic quality, e.g., surpassing the recent state of the art in unsupervised panoptic segmentation on Cityscapes by 9.4% points in PQ.
- Abstract(参考訳): 教師なしのパノプティックセグメンテーションは、手動でアノテートされたデータをトレーニングすることなく、イメージを意味のある領域と異なるオブジェクトインスタンスに分割することを目的としている。
教師なし単眼シーン理解の先行研究とは対照的に、対象中心のトレーニングデータの必要性を排除し、複雑なシーンの教師なし理解を可能にする。
そこで本研究では,シーン中心の画像を直接トレーニングする,教師なしの初めてのパン光学的手法を提案する。
特に、複雑なシーン中心のデータに基づいて、視覚的表現、深さ、動きの手がかりを組み合わせた高分解能パノプティカルな擬似ラベルを得る手法を提案する。
擬似ラベルトレーニングと汎視的自己学習戦略の両方を用いることで、人間のアノテーションを必要とせずに複雑なシーンの単視的セグメンテーションを正確に予測する新しいアプローチが得られる。
当社のアプローチは,PQの9.4%の精度でパン光学品質を大幅に向上させ,近年の非教師なしパン光学セグメンテーションの最先端を突破した。
関連論文リスト
- In-Place Panoptic Radiance Field Segmentation with Perceptual Prior for 3D Scene Understanding [1.8130068086063336]
そこで本研究では,視覚を主眼とした3次元シーン表現とパノプティクス理解手法を提案する。
2次元セマンティクスとインスタンス認識を含む線形代入問題として、神経放射場内のパノプティクス理解を再構成する。
合成シーンや実世界のシーンを含む課題条件下での実験とアブレーション研究は,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-10-06T15:49:58Z) - Object-level Scene Deocclusion [92.39886029550286]
オブジェクトレベルのシーン・デクルージョンのためのPArallel可視・コミュールト拡散フレームワークPACOを提案する。
PACOをトレーニングするために、500kサンプルの大規模なデータセットを作成し、自己教師付き学習を可能にします。
COCOAと様々な現実世界のシーンの実験では、PACOがシーンの排除に優れた能力を示し、芸術の状態をはるかに上回っている。
論文 参考訳(メタデータ) (2024-06-11T20:34:10Z) - Towards Deeply Unified Depth-aware Panoptic Segmentation with
Bi-directional Guidance Learning [63.63516124646916]
深度認識型パノプティックセグメンテーションのためのフレームワークを提案する。
本稿では,クロスタスク機能学習を容易にする双方向指導学習手法を提案する。
本手法は,Cityscapes-DVPS と SemKITTI-DVPS の両データセットを用いた深度認識型パノプティックセグメンテーションのための新しい手法である。
論文 参考訳(メタデータ) (2023-07-27T11:28:33Z) - Pointly-Supervised Panoptic Segmentation [106.68888377104886]
弱教師付き単眼セグメンテーションにポイントレベルのアノテーションを適用するための新しい手法を提案する。
完全に教師された方法で使用される高密度のピクセルレベルラベルの代わりに、ポイントレベルラベルは、監督対象ごとに単一のポイントしか提供しない。
我々は、ポイントレベルのラベルから同時に汎視的擬似マスクを生成し、それらから学習することで、エンドツーエンドのフレームワークにおける問題を定式化する。
論文 参考訳(メタデータ) (2022-10-25T12:03:51Z) - Panoramic Panoptic Segmentation: Insights Into Surrounding Parsing for
Mobile Agents via Unsupervised Contrastive Learning [93.6645991946674]
我々はパノラマパノラマパノプティクスのセグメンテーションを最も総合的なシーン理解として紹介する。
完全な周囲の理解は、移動エージェントに最大限の情報を提供する。
本稿では,標準的なピンホール画像のモデルトレーニングを可能にし,学習した特徴を別のドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T20:07:15Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Unsupervised Image Segmentation by Mutual Information Maximization and
Adversarial Regularization [7.165364364478119]
InMARS(Information Maximization and Adrial Regularization)と呼ばれる新しい教師なしセマンティックセマンティックセマンティクス手法を提案する。
シーンを知覚群に解析する人間の知覚に触発され、提案手法はまず、入力画像を意味のある領域(スーパーピクセルとも呼ばれる)に分割する。
次に、相互情報最大化(Multual-Information-Maximization)と、それらの領域を意味論的に意味のあるクラスにクラスタ化するための敵対的トレーニング戦略を利用する。
提案手法は2つの非教師付きセマンティックセグメンテーションデータセット上での最先端性能を実現することを実証した。
論文 参考訳(メタデータ) (2021-07-01T18:36:27Z) - Can we cover navigational perception needs of the visually impaired by
panoptic segmentation? [36.84154920632496]
視覚障害者のナビゲーション認知は、古典的・深層学習に基づくセグメンテーション手法によって著しく促進されている。
パノプティックセグメンテーション(英: Panoptic segmentation)は、セマンティックセグメンテーションとインスタンスセグメンテーションを統合することを目的とした、新しく提案された視覚モデルである。
本研究では, 視覚障害者に対して, ウェアラブル・アシスト・システムを用いて, 視覚障害者の視覚的情景認識を活用できることを実証する。
論文 参考訳(メタデータ) (2020-07-20T15:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。