論文の概要: SSG2: A new modelling paradigm for semantic segmentation
- arxiv url: http://arxiv.org/abs/2310.08671v1
- Date: Thu, 12 Oct 2023 19:08:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 15:54:09.958432
- Title: SSG2: A new modelling paradigm for semantic segmentation
- Title(参考訳): SSG2:セマンティックセグメンテーションのための新しいモデリングパラダイム
- Authors: Foivos I. Diakogiannis, Suzanne Furby, Peter Caccetta, Xiaoliang Wu,
Rodrigo Ibata, Ondrej Hlinka, John Taylor
- Abstract要約: セグメンテーションにおける最先端モデルは、単一の静的イメージで動作し、対応するセグメンテーションマスクを生成する。
セマンティック・チェンジ検出の研究から着想を得て,各静的な入力画像に対して生成した可観測物のシーケンスを活用する手法を提案する。
この「時間的」次元を追加することで、シーケンス内の連続した観測間の強い信号相関を利用してエラー率を減少させる。
オーストラリア・ダーウィンのUrbanMonitorは5つのスペクトルバンドと0.2mの空間解像度を持つ正像タイルを特徴とし、ISPRS Potsdamは複数のスペクトルバンドと5cmの地中サンプリングを含む真の正像画像を含む。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art models in semantic segmentation primarily operate on single,
static images, generating corresponding segmentation masks. This one-shot
approach leaves little room for error correction, as the models lack the
capability to integrate multiple observations for enhanced accuracy. Inspired
by work on semantic change detection, we address this limitation by introducing
a methodology that leverages a sequence of observables generated for each
static input image. By adding this "temporal" dimension, we exploit strong
signal correlations between successive observations in the sequence to reduce
error rates. Our framework, dubbed SSG2 (Semantic Segmentation Generation 2),
employs a dual-encoder, single-decoder base network augmented with a sequence
model. The base model learns to predict the set intersection, union, and
difference of labels from dual-input images. Given a fixed target input image
and a set of support images, the sequence model builds the predicted mask of
the target by synthesizing the partial views from each sequence step and
filtering out noise. We evaluate SSG2 across three diverse datasets:
UrbanMonitor, featuring orthoimage tiles from Darwin, Australia with five
spectral bands and 0.2m spatial resolution; ISPRS Potsdam, which includes true
orthophoto images with multiple spectral bands and a 5cm ground sampling
distance; and ISIC2018, a medical dataset focused on skin lesion segmentation,
particularly melanoma. The SSG2 model demonstrates rapid convergence within the
first few tens of epochs and significantly outperforms UNet-like baseline
models with the same number of gradient updates. However, the addition of the
temporal dimension results in an increased memory footprint. While this could
be a limitation, it is offset by the advent of higher-memory GPUs and coding
optimizations.
- Abstract(参考訳): セグメンテーションにおける最先端モデルは、主に単一の静的イメージで動作し、対応するセグメンテーションマスクを生成する。
このワンショットアプローチでは、モデルの精度向上のために複数の観測結果を統合できないため、エラー訂正の余地がほとんどない。
セマンティック・チェンジ検出の研究から着想を得たこの制限は,静的な入力画像毎に生成された可観測物のシーケンスを活用する手法を導入することで解決する。
この「時間的」次元を加えることで、連続する観測値間の強い信号相関を利用して誤り率を減少させる。
我々のフレームワークはSSG2(Semantic Segmentation Generation 2)と呼ばれ、シーケンスモデルで拡張されたデュアルエンコーダ、シングルデコーダベースネットワークを使用している。
基本モデルは、デュアル入力画像からのラベルのセットの交点、結合、および差を予測することを学ぶ。
固定された目標入力画像と一連の支持画像が与えられた場合、シーケンスモデルは、各シーケンスステップから部分ビューを合成し、ノイズを除去することにより、ターゲットの予測マスクを構築する。
われわれはSSG2を,オーストラリアのダーウィンで5つのスペクトル帯と0.2mの空間分解能を持つ正像タイルを特徴とするUrbanMonitor,複数のスペクトル帯を持つ真の正像像を含むISPRS Potsdam,皮膚病変のセグメンテーションに焦点を当てた医用データセットISIC2018の3つのデータセットで評価した。
ssg2モデルは、最初の数十年で急速に収束し、同じ数の勾配更新でunetライクなベースラインモデルを大きく上回っている。
しかし、時間次元が加わったことでメモリフットプリントが増加する。
これは制限かもしれないが、高メモリGPUの出現とコーディング最適化によってオフセットされる。
関連論文リスト
- SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.87694319431288]
一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。
画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。
漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文 参考訳(メタデータ) (2024-06-28T10:05:58Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Robust One-shot Segmentation of Brain Tissues via Image-aligned Style
Transformation [13.430851964063534]
本稿では,脳組織のワンショットセグメンテーションのための2モデル反復学習を強化するために,新しい画像整列型変換を提案する。
2つの公開データセットによる実験結果から,1)完全教師付き手法と比較して,提案手法の競合セグメンテーション性能が向上し,2)Diceの平均値が4.67%向上した他の最先端技術よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-11-26T09:14:01Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - On the Texture Bias for Few-Shot CNN Segmentation [21.349705243254423]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクを実行するために形状によって駆動される。
最近の証拠は、CNNのテクスチャバイアスが、大きなラベル付きトレーニングデータセットで学習するときに、より高いパフォーマンスのモデルを提供することを示している。
本稿では,特徴空間内の高周波局所成分を減衰させるために,ガウス差分(DoG)の集合を統合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-09T11:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。