論文の概要: Convolution-based Probability Gradient Loss for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2404.06704v1
- Date: Wed, 10 Apr 2024 03:20:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-11 15:39:25.687912
- Title: Convolution-based Probability Gradient Loss for Semantic Segmentation
- Title(参考訳): 畳み込みに基づくセマンティックセグメンテーションのための確率勾配損失
- Authors: Guohang Shan, Shuangcheng Jia,
- Abstract要約: 本稿では,意味的セグメンテーションのための新しいConvolution-based Probability Gradient (CPG)ロスを提案する。
ソベル演算子に似た畳み込みカーネルを使用し、画像中のピクセル強度の勾配を計算することができる。
我々は,CPG損失が3つの確立されたネットワークに与える影響を評価するために,定性的かつ定量的な分析を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce a novel Convolution-based Probability Gradient (CPG) loss for semantic segmentation. It employs convolution kernels similar to the Sobel operator, capable of computing the gradient of pixel intensity in an image. This enables the computation of gradients for both ground-truth and predicted category-wise probabilities. It enhances network performance by maximizing the similarity between these two probability gradients. Moreover, to specifically enhance accuracy near the object's boundary, we extract the object boundary based on the ground-truth probability gradient and exclusively apply the CPG loss to pixels belonging to boundaries. CPG loss proves to be highly convenient and effective. It establishes pixel relationships through convolution, calculating errors from a distinct dimension compared to pixel-wise loss functions such as cross-entropy loss. We conduct qualitative and quantitative analyses to evaluate the impact of the CPG loss on three well-established networks (DeepLabv3-Resnet50, HRNetV2-OCR, and LRASPP_MobileNet_V3_Large) across three standard segmentation datasets (Cityscapes, COCO-Stuff, ADE20K). Our extensive experimental results consistently and significantly demonstrate that the CPG loss enhances the mean Intersection over Union.
- Abstract(参考訳): 本稿では,意味的セグメンテーションのための新しいConvolution-based Probability Gradient (CPG)ロスを提案する。
ソベル演算子に似た畳み込みカーネルを使用し、画像中のピクセル強度の勾配を計算することができる。
これにより、グラウンドトルースと予測されたカテゴリワイド確率の両方の勾配の計算が可能となる。
これら2つの確率勾配の類似性を最大化することでネットワーク性能を向上させる。
さらに, 物体の境界付近の精度を高めるために, 接地確率勾配に基づいて物体境界を抽出し, CPG損失を境界に属する画素に限定的に適用する。
CPGの喪失は、非常に便利で効果的であることが証明されている。
畳み込みによる画素関係を確立し、クロスエントロピー損失のような画素単位の損失関数と比較して、異なる次元からの誤差を計算する。
我々は3つの標準セグメンテーションデータセット(Cityscapes, COCO-Stuff, ADE20K)において, CPG損失が3つの確立されたネットワーク(DeepLabv3-Resnet50, HRNetV2-OCR, LRASPP_MobileNet_V3_Large)に与える影響を評価するための質的および定量的解析を行った。
得られた実験結果から, CPG損失は, ユニオン平均断面積を増大させることが明らかとなった。
関連論文リスト
- Point Cloud Denoising With Fine-Granularity Dynamic Graph Convolutional Networks [58.050130177241186]
ノイズの摂動は、しばしば3次元の点雲を破損させ、表面の再構成、レンダリング、さらなる処理といった下流のタスクを妨げる。
本稿では,GDGCNと呼ばれる粒度動的グラフ畳み込みネットワークについて紹介する。
論文 参考訳(メタデータ) (2024-11-21T14:19:32Z) - TransUPR: A Transformer-based Uncertain Point Refiner for LiDAR Point
Cloud Semantic Segmentation [6.587305905804226]
本稿ではトランスUPR(Transformer-based certain point refiner)を提案する。
我々のTransUPRは最先端のパフォーマンス、すなわちSemantic KITTIベンチマーク上の68.2%のIntersection over Union(mIoU)を達成する。
論文 参考訳(メタデータ) (2023-02-16T21:38:36Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Pixel Contrastive-Consistent Semi-Supervised Semantic Segmentation [22.920856071095915]
セグメンテーションモデル正規性の2つのデシラタを共同で達成する半教師付きセグメンテーション手法を提案する。
画素レベルL2損失と画素コントラスト損失をそれぞれ2つの目的に活用する。
論文 参考訳(メタデータ) (2021-08-20T07:04:33Z) - PSGR: Pixel-wise Sparse Graph Reasoning for COVID-19 Pneumonia
Segmentation in CT Images [83.26057031236965]
画像中の新型コロナウイルス感染領域セグメンテーションの長距離依存性のモデリングを強化するために,PSGRモジュールを提案する。
PSGRモジュールは不正確なピクセルからノードへの投影を回避し、グローバルな推論のために各ピクセル固有の情報を保存する。
このソリューションは、3つの公開データセット上の4つの広く使われているセグメンテーションモデルに対して評価されている。
論文 参考訳(メタデータ) (2021-08-09T04:58:23Z) - Why Approximate Matrix Square Root Outperforms Accurate SVD in Global
Covariance Pooling? [59.820507600960745]
本稿では,前方通過のSVDと後方伝播のPad'e近似を用いて勾配を計算する新しいGCPメタ層を提案する。
提案するメタレイヤは,さまざまなCNNモデルに統合され,大規模および微細なデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-05-06T08:03:45Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - Improving Image co-segmentation via Deep Metric Learning [1.5076964620370268]
本稿では,IS-Triplet Los for Shortという,画像のトリプレットロスを新たに提案し,従来の画像分割損失と組み合わせた。
提案手法を画像共同分割に適用し,SBCosegデータセットとインターネットデータセット上でテストする。
論文 参考訳(メタデータ) (2021-03-19T07:30:42Z) - Semi-supervised Hyperspectral Image Classification with Graph Clustering
Convolutional Networks [41.78245271989529]
HSI分類のためのグラフ畳み込みネットワーク(GCN)に基づくフレームワークを提案する。
特に、類似のスペクトル特徴を持つ画素をスーパーピクセルにまずクラスターし、入力したhsiのスーパーピクセルに基づいてグラフを構築する。
その後、エッジを弱い重みで刻むことでいくつかの部分グラフに分割し、高い類似性を持つノードの相関性を強化する。
論文 参考訳(メタデータ) (2020-12-20T14:16:59Z) - Joint Multi-Dimension Pruning via Numerical Gradient Update [120.59697866489668]
本稿では,空間,深さ,チャネルの3つの重要な側面において,ネットワークを同時に切断する方法であるジョイント・マルチディメンジョン・プルーニング(ジョイント・プルーニング)を提案する。
本手法は,1つのエンドツーエンドトレーニングにおいて3次元にわたって協調的に最適化され,従来よりも効率がよいことを示す。
論文 参考訳(メタデータ) (2020-05-18T17:57:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。