論文の概要: Refining Semantic Segmentation with Superpixel by Transparent
Initialization and Sparse Encoder
- arxiv url: http://arxiv.org/abs/2010.04363v3
- Date: Tue, 24 Nov 2020 10:14:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 04:02:50.866595
- Title: Refining Semantic Segmentation with Superpixel by Transparent
Initialization and Sparse Encoder
- Title(参考訳): 透明初期化とスパースエンコーダによるスーパーピクセルによるセマンティックセマンティックセグメンテーション
- Authors: Zhiwei Xu, Thalaiyasingam Ajanthan, Richard Hartley
- Abstract要約: トレーニング可能なスーパーピクセルとセマンティックセグメンテーションを共同で学習する。
我々は、透過初期化(TI)とスパースエンコーダを用いた効率的なロジット整合性を備えた完全接続層で実現した。
性能比とF測定値を用いたセグメンテーションエッジの定量的評価により,本手法は最先端技術よりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 30.77717421722804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although deep learning greatly improves the performance of semantic
segmentation, its success mainly lies in object central areas without accurate
edges. As superpixels are a popular and effective auxiliary to preserve object
edges, in this paper, we jointly learn semantic segmentation with trainable
superpixels. We achieve it with fully-connected layers with Transparent
Initialization (TI) and efficient logit consistency using a sparse encoder. The
proposed TI preserves the effects of learned parameters of pretrained networks.
This avoids a significant increase of the loss of pretrained networks, which
otherwise may be caused by inappropriate parameter initialization of the
additional layers. Meanwhile, consistent pixel labels in each superpixel are
guaranteed by logit consistency. The sparse encoder with sparse matrix
operations substantially reduces both the memory requirement and the
computational complexity. We demonstrated the superiority of TI over other
parameter initialization methods and tested its numerical stability. The
effectiveness of our proposal was validated on PASCAL VOC 2012, ADE20K, and
PASCAL Context showing enhanced semantic segmentation edges. With quantitative
evaluations on segmentation edges using performance ratio and F-measure, our
method outperforms the state-of-the-art.
- Abstract(参考訳): 深層学習はセマンティックセグメンテーションの性能を大幅に向上させるが、その成功は主に正確なエッジを持たない対象中心領域にある。
スーパーピクセルは、オブジェクトエッジを保存するために人気があり効果的な補助となるため、トレーニング可能なスーパーピクセルとのセマンティックセグメンテーションを共同で学習する。
我々は、透過初期化(TI)とスパースエンコーダを用いた効率的なロジット整合性を備えた完全接続層で実現した。
提案したTIは,事前学習ネットワークの学習パラメータの効果を保存している。
これにより、事前訓練されたネットワークの損失が大幅に増加するのを避けることができ、そうでなければ、追加層の初期化が不適切なパラメータによって引き起こされる可能性がある。
一方、各スーパーピクセルの一貫性のあるピクセルラベルは、logit一貫性によって保証される。
スパース行列演算を持つスパースエンコーダは、メモリ要求と計算複雑性の両方を大幅に低減する。
他のパラメータ初期化法よりもtiが優れていることを実証し,その数値安定性を検証した。
提案手法の有効性をPASCAL VOC 2012,ADE20K,PASCAL Contextで検証した。
性能比とF測定値を用いたセグメンテーションエッジの定量的評価により,本手法は最先端技術よりも優れている。
関連論文リスト
- SSA-Seg: Semantic and Spatial Adaptive Pixel-level Classifier for Semantic Segmentation [11.176993272867396]
本稿ではセマンティック・空間適応(SSA-Seg)を提案し,セマンティックセグメンテーションの課題に対処する。
具体的には、固定されたプロトタイプから得られた粗いマスクを用いて、テスト画像のセマンティック領域と空間領域の中心に向けて固定されたプロトタイプを調整する。
その結果,提案したSSA-Segは,計算コストを最小限に抑えながら,ベースラインモデルのセグメンテーション性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-10T15:14:23Z) - Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.09251327650334]
セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。
提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文 参考訳(メタデータ) (2023-09-11T14:32:04Z) - Efficient Multiscale Object-based Superpixel Framework [62.48475585798724]
我々は,SICLE(Iterative CLEarcutting)によるスーパーピクセルという,新しいスーパーピクセルフレームワークを提案する。
SICLEは、複数スケールのセグメンテーションをオンザフライで生成できるオブジェクト情報を利用する。
これは最近のスーパーピクセル法を一般化し、複数のデライン化指標に従って効率と効率性に関する最先端のアプローチを超越している。
論文 参考訳(メタデータ) (2022-04-07T15:59:38Z) - Image-free single-pixel segmentation [3.3808025405314086]
本稿では,画像のない単一画素分割技術について報告する。
この技術は、構造的照明と単画素検出を組み合わせることで、シーンのセグメンテーション情報を効率的にサンプリングし、多重化する。
この画像自由分割技術は、UAVや無人車両など、様々なリソース制限されたプラットフォームに広く応用できると期待する。
論文 参考訳(メタデータ) (2021-08-24T10:06:53Z) - Evidential fully convolutional network for semantic segmentation [6.230751621285322]
本稿では,完全畳み込みネットワーク(fcn)と,イメージセマンティクスセグメンテーションのためのデンプスターシェーファー層からなるハイブリッドアーキテクチャを提案する。
提案手法は,多クラス集合に混乱する画素を割り当てることで,意味セグメンテーションの精度とキャリブレーションを改善することを示す。
論文 参考訳(メタデータ) (2021-03-25T01:21:22Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Contrastive Learning for Label-Efficient Semantic Segmentation [44.10416030868873]
Convolutional Neural Network(CNN)ベースのセマンティックセグメンテーションアプローチは、大量のラベル付きデータを使用して印象的な結果を達成しました。
事実上のクロスエントロピー損失でトレーニングされたディープCNNは、少量のラベル付きデータに容易に適合する。
簡便で効果的な対比学習型トレーニング戦略を提案し、まずはピクセル単位のラベルベースの対比損失を用いてネットワークを前訓練します。
論文 参考訳(メタデータ) (2020-12-13T07:05:39Z) - Dense Contrastive Learning for Self-Supervised Visual Pre-Training [102.15325936477362]
入力画像の2つのビュー間の画素レベルでの差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分)を最適化することにより自己教師学習を実現する。
ベースライン法であるMoCo-v2と比較すると,計算オーバーヘッドは1%遅かった。
論文 参考訳(メタデータ) (2020-11-18T08:42:32Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。