論文の概要: ES-CRF: Embedded Superpixel CRF for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2112.07106v1
- Date: Tue, 14 Dec 2021 02:06:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:06:08.976000
- Title: ES-CRF: Embedded Superpixel CRF for Semantic Segmentation
- Title(参考訳): ES-CRF:セマンティックセグメンテーションのための埋め込みスーパーピクセルCRF
- Authors: Jie Zhu, Huabin Huang, Banghuai Li, Leye Wang
- Abstract要約: 境界画素の特徴表現を浄化するために,組込みスーパーピクセルCRF (ES-CRF) という新しい手法を提案する。
ES-CRFは、より効率的なエンドツーエンド最適化のためにCNNネットワークにCRF機構を融合する。
これは2つの挑戦的なベンチマーク、すなわちCityscapesとADE20Kで新しい記録を作成した。
- 参考スコア(独自算出の注目度): 9.759391777814619
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Modern semantic segmentation methods devote much attention to adjusting
feature representations to improve the segmentation performance in various
ways, such as metric learning, architecture design, etc. However, almost all
those methods neglect the particularity of boundary pixels. These pixels are
prone to obtain confusing features from both sides due to the continuous
expansion of receptive fields in CNN networks. In this way, they will mislead
the model optimization direction and make the class weights of such categories
that tend to share many adjacent pixels lack discrimination, which will damage
the overall performance. In this work, we dive deep into this problem and
propose a novel method named Embedded Superpixel CRF (ES-CRF) to address it.
ES-CRF involves two main aspects. On the one hand, ES-CRF innovatively fuses
the CRF mechanism into the CNN network as an organic whole for more effective
end-to-end optimization. It utilizes CRF to guide the message passing between
pixels in high-level features to purify the feature representation of boundary
pixels, with the help of inner pixels belong to the same object. On the other
hand, superpixel is integrated into ES-CRF to exploit the local object prior
for more reliable message passing. Finally, our proposed method yields new
records on two challenging benchmarks, i.e., Cityscapes and ADE20K. Moreover,
we make detailed theoretical analysis to verify the superiority of ES-CRF.
- Abstract(参考訳): 現代のセマンティックセグメンテーション手法は、メトリクス学習やアーキテクチャ設計など、様々な方法でセグメンテーション性能を改善するために特徴表現を調整することに多くの注意を払っている。
しかし、これらの手法のほとんどは境界画素の特異性を無視している。
これらのピクセルは、cnnネットワークにおける受容野の連続的な拡大のため、両側から紛らわしい特徴を得る傾向がある。
このようにして、モデル最適化の方向性を誤解させ、隣接する多くのピクセルを共有する傾向にあるカテゴリのクラス重みを識別できないようにし、全体的な性能を損なう。
本研究では,この問題を深く掘り下げて,組込みスーパーピクセルCRF (ES-CRF) という新しい手法を提案する。
ES-CRFには2つの主な側面がある。
一方、ES-CRFは、より効率的なエンドツーエンド最適化のために、CRF機構を有機的にCNNネットワークに融合させる。
CRFを利用して、高レベルの特徴においてピクセル間のメッセージパッシングを誘導し、内部ピクセルの助けを借りて境界画素の特徴表現を浄化する。
一方、スーパーピクセルはES-CRFに統合され、より信頼性の高いメッセージパッシングに先立ってローカルオブジェクトを利用する。
最後に,提案手法は,Cityscapes と ADE20K の2つの挑戦的ベンチマークに新たな記録を与える。
さらに,ES-CRFの優位性を検証するため,詳細な理論的解析を行った。
関連論文リスト
- Leveraging Adaptive Implicit Representation Mapping for Ultra High-Resolution Image Segmentation [19.87987918759425]
入射表現マッピング(IRM)は、画像特徴を任意の連続分解能に変換することができ、超高分解能画像分割精細化のための強力な能力を示す。
IRMをベースとした現在の超高解像度画像分割法は、画像の特徴を抽出するためにCNNベースのエンコーダに依存することが多い。
超高解像度イメージ関数に対して,新たに提案したImplicit Representation Mapping (AIRM) を利用した新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-31T00:34:37Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - SANeRF-HQ: Segment Anything for NeRF in High Quality [61.77762568224097]
本研究では,高品質な物体の高品質な3次元セグメンテーションを実現するために,SANeRF-HQ(Segment Anything for NeRF in High Quality)を提案する。
我々は,集約時のセグメンテーション境界の精度を高めるために密度場とRGB類似性を用いる。
論文 参考訳(メタデータ) (2023-12-03T23:09:38Z) - GP-NeRF: Generalized Perception NeRF for Context-Aware 3D Scene Understanding [101.32590239809113]
Generalized Perception NeRF (GP-NeRF) は、広く使われているセグメンテーションモデルとNeRFを統一されたフレームワークで相互に動作させる新しいパイプラインである。
本稿では,セマンティック蒸留損失(Semantic Distill Loss)とDepth-Guided Semantic Distill Loss(Depth-Guided Semantic Distill Loss)という2つの自己蒸留機構を提案する。
論文 参考訳(メタデータ) (2023-11-20T15:59:41Z) - Efficient fine-grained road segmentation using superpixel-based CNN and
CRF models [0.0]
本稿では,道路分割作業におけるCNNの利点を合理的な計算力で活用するための新しい手法を提案する。
提案システムは,KITTIロードベンチマークにおいて,上位性能のアルゴリズムに匹敵する性能を得た。
論文 参考訳(メタデータ) (2022-06-22T12:38:30Z) - Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。
このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。
BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文 参考訳(メタデータ) (2022-06-21T09:30:26Z) - NeW CRFs: Neural Window Fully-connected CRFs for Monocular Depth
Estimation [42.062788492398674]
単一の画像から正確な深度を推定することは、本質的に曖昧で不適切であるため難しい。
CRFの最適化の道をたどって、完全に接続されたCRFの可能性を活用します。
提案手法は,KITTIとNYUv2の両方のデータセットにおいて,すべてのメトリクスのパフォーマンスを著しく向上させる。
論文 参考訳(メタデータ) (2022-03-03T03:27:20Z) - Semantic Segmentation by Improved Generative Adversarial Networks [0.0]
画像セマンティックセグメンテーションタスクの効果的な改善ソリューションとして、Convolutional CRF(ConvCRF)を紹介します。
提案手法は,入力画像から対応する出力画像へのエンドツーエンドマッピングを学習するだけでなく,このマッピングをトレーニングするための損失関数も学習する。
論文 参考訳(メタデータ) (2021-04-20T11:59:29Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - CARAFE++: Unified Content-Aware ReAssembly of FEatures [132.49582482421246]
この目標を達成するために、ユニバーサルで軽量で高効率なオペレータであるContent-Aware ReAssembly of FEatures(CARAFE++)を提案します。
CARAFE++は、インスタンス固有のコンテンツ認識処理を可能にするアダプティブカーネルをオンザフライで生成する。
計算のオーバーヘッドが無視できるすべてのタスクにおいて、一貫性と実質的な利益を示しています。
論文 参考訳(メタデータ) (2020-12-07T07:34:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。