論文の概要: Weakly-Supervised Semantic Segmentation of Circular-Scan,
Synthetic-Aperture-Sonar Imagery
- arxiv url: http://arxiv.org/abs/2401.11313v1
- Date: Sat, 20 Jan 2024 19:55:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 17:07:45.927804
- Title: Weakly-Supervised Semantic Segmentation of Circular-Scan,
Synthetic-Aperture-Sonar Imagery
- Title(参考訳): 円走査型合成アパーチャー超音波画像の弱教師付き意味セグメンテーション
- Authors: Isaac J. Sledge, Dominic M. Byrne, Jonathan L. King, Steven H.
Ostertag, Denton L. Woods, James L. Prater, Jermaine L. Kennedy, Timothy M.
Marston, Jose C. Principe
- Abstract要約: 本稿では,円スキャン合成開口ソナー(CSAS)画像のセマンティックセグメンテーションのための弱教師付きフレームワークを提案する。
我々は,9つの完全教師付きディープネットワークに対して,我々のフレームワークが相互運用可能であることを示す。
我々は,自然画像の事前学習において,最先端の性能を達成する。
- 参考スコア(独自算出の注目度): 3.5534342430133514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a weakly-supervised framework for the semantic segmentation of
circular-scan synthetic-aperture-sonar (CSAS) imagery. The first part of our
framework is trained in a supervised manner, on image-level labels, to uncover
a set of semi-sparse, spatially-discriminative regions in each image. The
classification uncertainty of each region is then evaluated. Those areas with
the lowest uncertainties are then chosen to be weakly labeled segmentation
seeds, at the pixel level, for the second part of the framework. Each of the
seed extents are progressively resized according to an unsupervised,
information-theoretic loss with structured-prediction regularizers. This
reshaping process uses multi-scale, adaptively-weighted features to delineate
class-specific transitions in local image content. Content-addressable memories
are inserted at various parts of our framework so that it can leverage features
from previously seen images to improve segmentation performance for related
images.
We evaluate our weakly-supervised framework using real-world CSAS imagery
that contains over ten seafloor classes and ten target classes. We show that
our framework performs comparably to nine fully-supervised deep networks. Our
framework also outperforms eleven of the best weakly-supervised deep networks.
We achieve state-of-the-art performance when pre-training on natural imagery.
The average absolute performance gap to the next-best weakly-supervised network
is well over ten percent for both natural imagery and sonar imagery. This gap
is found to be statistically significant.
- Abstract(参考訳): 円スキャン合成アパーチャーソナー(csas)画像の意味セグメンテーションのための弱教師付きフレームワークを提案する。
筆者らのフレームワークの第1部は、画像レベルのラベルに基づいて教師付き方法で訓練され、各画像内の半スパース領域の集合を明らかにする。
次に、各領域の分類の不確実性を評価する。
最も不確実性の低い領域は、フレームワークの第2部分のピクセルレベルで、弱いラベル付けされたセグメンテーションシードとして選択される。
各種の範囲は、構造化予測正則化器による教師なし情報理論的損失に応じて徐々に再サイズされる。
マルチスケールで適応的に重み付けされた特徴を用いて、局所的な画像内容のクラス固有の遷移を規定する。
関連画像のセグメンテーション性能を向上させるために、予め見てきた画像の特徴を活用できるように、コンテント調整可能なメモリをフレームワークの様々な部分に挿入する。
10以上の海底クラスと10以上のターゲットクラスを含む実世界のCSAS画像を用いて、弱教師付きフレームワークの評価を行った。
我々のフレームワークは、9つの完全教師付きディープネットワークと互換性のある性能を示す。
私たちのフレームワークは、最も弱い教師付きディープネットワークの11よりも優れています。
自然画像の事前学習において,最先端のパフォーマンスを実現する。
最弱教師付きネットワークに対する平均的な絶対的なパフォーマンスギャップは、自然画像とソナー画像の両方に対してほぼ10%以上である。
この差は統計的に有意である。
関連論文リスト
- Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - ISLE: A Framework for Image Level Semantic Segmentation Ensemble [5.137284292672375]
従来のセマンティックセグメンテーションネットワークは、最先端の予測品質に到達するために、大量のピクセル単位のアノテートラベルを必要とする。
クラスレベルで異なるセマンティックセグメンテーション手法のセットに「擬似ラベル」のアンサンブルを用いるISLEを提案する。
私たちはISLEの個々のコンポーネントよりも2.4%改善しています。
論文 参考訳(メタデータ) (2023-03-14T13:36:36Z) - Semi-supervised domain adaptation with CycleGAN guided by a downstream
task loss [4.941630596191806]
ドメイン適応は、ラベル付けが高価でエラーを起こしやすいタスクであるため、非常に興味深い。
画像から画像へのアプローチは、入力のシフトを軽減するために使用することができる。
本稿では、画像から画像へのドメイン適応アプローチにおいて、GANの「タスク認識」バージョンを提案する。
論文 参考訳(メタデータ) (2022-08-18T13:13:30Z) - Dense Siamese Network [86.23741104851383]
本稿では,Dense Siamese Network(DenseSiam)を提案する。
画像の2つのビュー間の類似性を最大化し、ピクセルの一貫性と領域の一貫性という2種類の一貫性を学習する。
最先端のセグメンテーション手法を2.1 mIoUで28%のトレーニングコストで上回っている。
論文 参考訳(メタデータ) (2022-03-21T15:55:23Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained
Vision-language Model [61.58071099082296]
オブジェクト検出やセマンティックセグメンテーションといった、より広範な視覚問題に対して、ゼロショット認識をどのようにうまく機能させるかは定かではない。
本稿では,既訓練の視覚言語モデルであるCLIPを用いて,ゼロショットセマンティックセマンティックセマンティックセマンティクスを構築することを目的とした。
実験結果から, この単純なフレームワークは, 従来の最先端をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-12-29T18:56:18Z) - Unsupervised Image Segmentation by Mutual Information Maximization and
Adversarial Regularization [7.165364364478119]
InMARS(Information Maximization and Adrial Regularization)と呼ばれる新しい教師なしセマンティックセマンティックセマンティクス手法を提案する。
シーンを知覚群に解析する人間の知覚に触発され、提案手法はまず、入力画像を意味のある領域(スーパーピクセルとも呼ばれる)に分割する。
次に、相互情報最大化(Multual-Information-Maximization)と、それらの領域を意味論的に意味のあるクラスにクラスタ化するための敵対的トレーニング戦略を利用する。
提案手法は2つの非教師付きセマンティックセグメンテーションデータセット上での最先端性能を実現することを実証した。
論文 参考訳(メタデータ) (2021-07-01T18:36:27Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。