論文の概要: Harmonizing Output Imbalance for semantic segmentation on
extremely-imbalanced input data
- arxiv url: http://arxiv.org/abs/2211.05295v1
- Date: Thu, 10 Nov 2022 02:05:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:57:21.069510
- Title: Harmonizing Output Imbalance for semantic segmentation on
extremely-imbalanced input data
- Title(参考訳): 超不均衡入力データにおけるセマンティックセグメンテーションのための高調波出力不均衡
- Authors: Jianye Yi, Xiaopin Zhong, Weixiang Liu, Zongze Wu and Yuanlong Deng
- Abstract要約: 対象画素と背景画素との比率が1:1000未満である極端に不均衡なデータに対処することは困難である。
本稿では,極端不均衡データに対する3つの課題について考察する。
- 参考スコア(独自算出の注目度): 4.611079243361505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation is a high level computer vision task that assigns a
label for each pixel of an image. It is challengeful to deal with
extremely-imbalanced data in which the ratio of target ixels to background
pixels is lower than 1:1000. Such severe input imbalance leads to output
imbalance for poor model training. This paper considers three issues for
extremely-imbalanced data: inspired by the region based loss, an implicit
measure for the output imbalance is proposed, and an adaptive algorithm is
designed for guiding the output imbalance hyperparameter selection; then it is
generalized to distribution based loss for dealing with output imbalance; and
finally a compound loss with our adaptive hyperparameter selection alogorithm
can keep the consistency of training and inference for harmonizing the output
imbalance. With four popular deep architectures on our private dataset with
three input imbalance scales and three public datasets, extensive experiments
demonstrate the ompetitive/promising performance of the proposed method.
- Abstract(参考訳): セマンティックセグメンテーション(Semantic segmentation)は、画像の各ピクセルにラベルを割り当てる高レベルのコンピュータビジョンタスクである。
背景画素に対するターゲットixelの比率が1:1000未満の極めて不均衡なデータを扱うのは困難である。
このような入力の不均衡は、貧弱なモデルトレーニングの出力不均衡につながる。
This paper considers three issues for extremely-imbalanced data: inspired by the region based loss, an implicit measure for the output imbalance is proposed, and an adaptive algorithm is designed for guiding the output imbalance hyperparameter selection; then it is generalized to distribution based loss for dealing with output imbalance; and finally a compound loss with our adaptive hyperparameter selection alogorithm can keep the consistency of training and inference for harmonizing the output imbalance.
3つの入力不均衡スケールと3つの公開データセットを持つプライベートデータセットに4つの人気のディープアーキテクチャを組み込むことで、提案手法の有効性を実証した。
関連論文リスト
- Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - An extended asymmetric sigmoid with Perceptron (SIGTRON) for imbalanced linear classification [0.0]
本稿では、SIGTRONと呼ばれる新しいパラメータ化シグモノイドと、SIGTRON不均衡分類(SIC)モデルと呼ばれる同伴凸モデルを提案する。
従来の$pi$重み付きコスト依存学習モデルとは対照的に、SICモデルは損失関数に外部の$pi$重みを持たない。
提案したSICモデルは,データセットのバリエーションに適応可能であることを示す。
論文 参考訳(メタデータ) (2023-12-26T13:14:17Z) - DiffusionPCR: Diffusion Models for Robust Multi-Step Point Cloud
Registration [73.37538551605712]
ポイントクラウド登録(PCR)は、2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では, PCR を拡散確率過程として定式化し, ノイズ変換を基礎的真理にマッピングする。
実験ではDiffusionPCRの有効性を示し,3Dおよび3DLoMatchに対する最先端の登録リコール率(95.3%/81.6%)を得た。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - Investigating Shift Equivalence of Convolutional Neural Networks in
Industrial Defect Segmentation [3.843350895842836]
産業欠陥分割タスクでは、モデルの出力整合性(等価性とも呼ばれる)がしばしば見過ごされる。
CNNにおける従来のサンプリングレイヤの代替として,コンポーネントアテンション多相サンプリング(CAPS)と呼ばれる新しいダウン/アップサンプリング層が提案されている。
マイクロサーフェス欠陥(MSD)データセットと4つの実世界の産業的欠陥データセットの実験結果から,提案手法は高い等価性とセグメンテーション性能を示すことが示された。
論文 参考訳(メタデータ) (2023-09-29T00:04:47Z) - Fault diagnosis for PV arrays considering dust impact based on
transformed graphical feature of characteristic curves and convolutional
neural network with CBAM modules [3.8256083307758804]
ダスト衝突を考慮したPVアレイの故障診断手法を提案する。
畳み込みブロックアテンションモジュール (CBAM) を用いた畳み込みニューラルネットワーク (CNN) のモデルは, 故障の識別情報を抽出するために設計されている。
種々の動作条件下で異なるブロッキングダイオード構成を持つPVアレイの開発手法は、高い故障診断精度と信頼性を有する。
論文 参考訳(メタデータ) (2023-03-24T09:55:11Z) - Meta-Causal Feature Learning for Out-of-Distribution Generalization [71.38239243414091]
本稿では,協調タスク生成モジュール (BTG) とメタ因果特徴学習モジュール (MCFL) を含む,バランス付きメタ因果学習器 (BMCL) を提案する。
BMCLは、分類のためのクラス不変の視覚領域を効果的に識別し、最先端の手法の性能を向上させるための一般的なフレームワークとして機能する。
論文 参考訳(メタデータ) (2022-08-22T09:07:02Z) - Uncovering the Over-smoothing Challenge in Image Super-Resolution: Entropy-based Quantification and Contrastive Optimization [67.99082021804145]
我々はDetail Enhanced Contrastive Loss (DECLoss)と呼ばれるCOO問題に対する明確な解決策を提案する。
DECLossはコントラスト学習のクラスタリング特性を利用して、潜在的な高分解能分布の分散を直接的に低減する。
我々は複数の超高解像度ベンチマーク上でDECLosを評価し,PSNR指向モデルの知覚品質を向上させることを実証した。
論文 参考訳(メタデータ) (2022-01-04T08:30:09Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - L3C-Stereo: Lossless Compression for Stereo Images [24.6995551743392]
多くの自律運転タスクは高解像度ステレオ画像を必要とし、大量のストレージスペースを必要とする。
そこで本研究では,2つの主モジュールからなるマルチスケールロスレス圧縮モデルであるL3C-Stereoを提案する。
実験では,手作り圧縮法と学習ベース法を3つのデータセットで比較した。
論文 参考訳(メタデータ) (2021-08-21T02:36:15Z) - Segmentation of cell-level anomalies in electroluminescence images of
photovoltaic modules [0.0]
本研究では,太陽電池モジュール全体からセルレベルの異常を検出し,検出し,セグメント化するエンド・ツー・エンドのディープラーニングパイプラインを提案する。
提案したモジュールパイプラインは,3つのディープラーニング技術を組み合わせている。 1. オブジェクト検出(Modified Faster-RNN), 2. 画像分類(EfficientNet), 3. 弱教師付きセグメンテーション(autoencoder)。
論文 参考訳(メタデータ) (2021-06-21T10:17:40Z) - Learnable Cost Volume Using the Cayley Representation [67.19770048548232]
光フロー推定モデルのための学習可能なコストボリューム(LCV)を提案する。
提案したLCVは軽量モジュールであり、バニラコストのボリュームを置き換えるために既存のモデルに簡単にプラグインできる。
実験結果から,LCVモジュールは標準ベンチマークにおける最先端モデルの精度を向上するだけでなく,信号の照度変化や雑音,対向的摂動に対する頑健性も向上することが示された。
論文 参考訳(メタデータ) (2020-07-21T01:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。