論文の概要: Clustering as Attention: Unified Image Segmentation with Hierarchical
Clustering
- arxiv url: http://arxiv.org/abs/2205.09949v1
- Date: Fri, 20 May 2022 03:53:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 06:56:47.135795
- Title: Clustering as Attention: Unified Image Segmentation with Hierarchical
Clustering
- Title(参考訳): 注意すべきクラスタリング:階層的クラスタリングによる統一イメージセグメンテーション
- Authors: Teppei Suzuki
- Abstract要約: 本稿では、HCFormerと呼ばれる深層ニューラルネットワークのための階層的クラスタリングに基づく画像分割手法を提案する。
画像のセグメンテーションは、セマンティック、インスタンス、パノプティックセグメンテーションを含む、ピクセルクラスタリングの問題として解釈し、ディープニューラルネットワークを用いたボトムアップ階層クラスタリングによって達成する。
- 参考スコア(独自算出の注目度): 11.696069523681178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a hierarchical clustering-based image segmentation scheme for deep
neural networks, called HCFormer. We interpret image segmentation, including
semantic, instance, and panoptic segmentation, as a pixel clustering problem,
and accomplish it by bottom-up, hierarchical clustering with deep neural
networks. Our hierarchical clustering removes the pixel decoder from
conventional segmentation models and simplifies the segmentation pipeline,
resulting in improved segmentation accuracies and interpretability. HCFormer
can address semantic, instance, and panoptic segmentation with the same
architecture because the pixel clustering is a common approach for various
image segmentation. In experiments, HCFormer achieves comparable or superior
segmentation accuracies compared to baseline methods on semantic segmentation
(55.5 mIoU on ADE20K), instance segmentation (47.1 AP on COCO), and panoptic
segmentation (55.7 PQ on COCO).
- Abstract(参考訳): HCFormerと呼ばれる深層ニューラルネットワークのための階層的クラスタリングに基づく画像分割手法を提案する。
ピクセルクラスタリング問題として,セマンティック,インスタンス,パンオプティカルセグメンテーションを含む画像セグメンテーションを解釈し,ディープニューラルネットワークを用いたボトムアップ階層クラスタリングによって達成する。
階層クラスタリングでは,従来のセグメンテーションモデルから画素デコーダを取り除き,セグメンテーションパイプラインを単純化し,セグメンテーション精度と解釈性を向上させる。
HCFormerは、ピクセルクラスタリングが様々なイメージセグメンテーションの一般的なアプローチであるため、同じアーキテクチャでセマンティック、インスタンス、およびパン光学セグメンテーションに対処することができる。
実験では、HCFormerはセマンティックセグメンテーション(ADE20Kでは55.5 mIoU)、インスタンスセグメンテーション(COCOでは47.1 AP)、パノプティックセグメンテーション(COCOでは55.7 PQ)のベースライン手法と比較して、同等または優れたセグメンテーション精度を達成する。
関連論文リスト
- Unsupervised Universal Image Segmentation [59.0383635597103]
本稿では,Unsupervised Universal Model (U2Seg) を提案する。
U2Segは、自己教師付きモデルを利用して、これらのセグメンテーションタスクの擬似意味ラベルを生成する。
次に、これらの擬似意味ラベル上でモデルを自己学習し、かなりの性能向上をもたらす。
論文 参考訳(メタデータ) (2023-12-28T18:59:04Z) - A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation [91.91385816767057]
オープンボキャブラリセマンティックセグメンテーションは、ピクセルをオープンなカテゴリの集合から異なるセマンティックグループに区別する試みである。
オープン語彙セマンティックセグメンテーションのための単純なエンコーダデコーダSEDを提案する。
SED法では、ADE20KではmIoUスコアが31.6%、A6000では画像あたり82ミリ秒(ms$)のカテゴリが150である。
論文 参考訳(メタデータ) (2023-11-27T05:00:38Z) - Hierarchical Dense Correlation Distillation for Few-Shot Segmentation [46.696051965252934]
Few-shot semantic segmentation (FSS) は、いくつかのアノテーションだけで見えないクラスをセグメンテーションするクラスに依存しないモデルを構築することを目的としている。
我々は、トランスアーキテクチャに基づく階層的分離マッチングネットワーク(HDMNet)マイニングピクセルレベルのサポート相関を設計する。
本稿では,列車セットの過度適合を低減し,粗い分解から意味対応を生かした相関蒸留を導入し,細粒度セグメンテーションを向上するマッチングモジュールを提案する。
論文 参考訳(メタデータ) (2023-03-26T08:13:12Z) - DeepCut: Unsupervised Segmentation using Graph Neural Networks
Clustering [6.447863458841379]
本研究では,従来のクラスタリング手法を置き換える軽量グラフニューラルネットワーク(GNN)を提案する。
既存の手法とは異なり、GNNはローカル画像特徴と生特徴とのペアワイズ親和性の両方を入力として取ります。
画像セグメンテーションGNNを訓練するための自己教師付き損失関数として,古典的クラスタリングの目的を定式化する方法を実証する。
論文 参考訳(メタデータ) (2022-12-12T12:31:46Z) - Open-world Semantic Segmentation via Contrasting and Clustering
Vision-Language Embedding [95.78002228538841]
本研究では,様々なオープンワールドカテゴリのセマンティックオブジェクトを高密度アノテーションを使わずにセマンティックオブジェクトのセマンティックオブジェクトのセマンティック化を学習するための,新しいオープンワールドセマンティックセマンティックセマンティックセマンティクスパイプラインを提案する。
提案手法は任意のカテゴリのオブジェクトを直接分割し、3つのベンチマークデータセット上でデータラベリングを必要とするゼロショットセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2022-07-18T09:20:04Z) - Distilling Ensemble of Explanations for Weakly-Supervised Pre-Training
of Image Segmentation Models [54.49581189337848]
本稿では,分類データセットに基づく画像分割モデルのエンドツーエンド事前学習を可能にする手法を提案する。
提案手法は重み付きセグメンテーション学習法を利用して,重み付きセグメンテーションネットワークを事前訓練する。
実験の結果,ImageNetにソースデータセットとしてPSSLを伴って提案されたエンドツーエンドの事前トレーニング戦略が,さまざまなセグメンテーションモデルの性能向上に成功していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T13:02:32Z) - Unsupervised Hierarchical Semantic Segmentation with Multiview
Cosegmentation and Clustering Transformers [47.45830503277631]
グループ化は自然に粒度のレベルを持ち、教師なしのセグメンテーションにおいて曖昧さを生み出す。
階層的セグメンテーショングループ(HSG)と呼ばれる,データ駆動型非教師付き階層的セグメンテーション手法を初めて提供する。
論文 参考訳(メタデータ) (2022-04-25T04:40:46Z) - Deep Hierarchical Semantic Segmentation [76.40565872257709]
階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文 参考訳(メタデータ) (2022-03-27T15:47:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。