論文の概要: Multi-task deep learning for image segmentation using recursive
approximation tasks
- arxiv url: http://arxiv.org/abs/2005.13053v1
- Date: Tue, 26 May 2020 21:35:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 23:56:06.163325
- Title: Multi-task deep learning for image segmentation using recursive
approximation tasks
- Title(参考訳): 再帰近似タスクを用いた画像分割のためのマルチタスクディープラーニング
- Authors: Rihuan Ke, Aur\'elie Bugeau, Nicolas Papadakis, Mark Kirkland, Peter
Schuetz, Carola-Bibiane Sch\"onlieb
- Abstract要約: セグメンテーションのためのディープニューラルネットワークは通常、手作業で作成するのに高価な大量のピクセルレベルのラベルを必要とする。
本研究では,この制約を緩和するマルチタスク学習手法を提案する。
ネットワークは、非常に少量の精度で区切られた画像と大量の粗いラベルで訓練されている。
- 参考スコア(独自算出の注目度): 5.735162284272276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fully supervised deep neural networks for segmentation usually require a
massive amount of pixel-level labels which are manually expensive to create. In
this work, we develop a multi-task learning method to relax this constraint. We
regard the segmentation problem as a sequence of approximation subproblems that
are recursively defined and in increasing levels of approximation accuracy. The
subproblems are handled by a framework that consists of 1) a segmentation task
that learns from pixel-level ground truth segmentation masks of a small
fraction of the images, 2) a recursive approximation task that conducts partial
object regions learning and data-driven mask evolution starting from partial
masks of each object instance, and 3) other problem oriented auxiliary tasks
that are trained with sparse annotations and promote the learning of dedicated
features. Most training images are only labeled by (rough) partial masks, which
do not contain exact object boundaries, rather than by their full segmentation
masks. During the training phase, the approximation task learns the statistics
of these partial masks, and the partial regions are recursively increased
towards object boundaries aided by the learned information from the
segmentation task in a fully data-driven fashion. The network is trained on an
extremely small amount of precisely segmented images and a large set of coarse
labels. Annotations can thus be obtained in a cheap way. We demonstrate the
efficiency of our approach in three applications with microscopy images and
ultrasound images.
- Abstract(参考訳): セグメンテーションのための完全な教師付きディープニューラルネットワークは、通常大量のピクセルレベルのラベルを必要とする。
本研究では,この制約を緩和するマルチタスク学習手法を開発した。
セグメンテーション問題は再帰的に定義された近似部分問題の列であり、近似精度のレベルが増大すると見なす。
サブプロブレムは、構成するフレームワークによって処理される
1)少数の画像の画素レベルの地上真実分割マスクから学習するセグメンテーションタスク。
2)各オブジェクトインスタンスの部分マスクから始まる部分対象領域の学習とデータ駆動型マスクの進化を行う再帰的近似タスク
3)他の問題指向の補助タスクは、疎アノテーションで訓練され、専用の機能の学習を促進する。
ほとんどのトレーニングイメージは、完全なセグメンテーションマスクではなく、正確なオブジェクト境界を含まない(ロー)部分マスクによってのみラベル付けされる。
トレーニングフェーズ中、近似タスクは、これらの部分マスクの統計を学習し、完全データ駆動の方法で、セグメンテーションタスクからの学習情報によって支援されたオブジェクト境界に向かって再帰的に部分領域を増加させる。
ネットワークは、非常に少量の精度で区切られた画像と大量の粗いラベルで訓練されている。
したがって、アノテーションは安価に得ることができる。
顕微鏡画像と超音波画像の3つの応用において,本手法の有効性を実証する。
関連論文リスト
- Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Learning to Annotate Part Segmentation with Gradient Matching [58.100715754135685]
本稿では,事前学習したGANを用いて,高品質な画像を生成することで,半教師付き部分分割タスクに対処することに焦点を当てる。
特に、アノテータ学習を学習から学習までの問題として定式化する。
提案手法は,実画像,生成された画像,さらには解析的に描画された画像を含む,幅広いラベル付き画像からアノテータを学習可能であることを示す。
論文 参考訳(メタデータ) (2022-11-06T01:29:22Z) - Learning to segment from object sizes [0.0]
本稿では,数画素の注釈付き画像と既知のオブジェクトサイズを持つ多数の画像のデータセットから,ディープセグメンテーションネットワークをトレーニングするアルゴリズムを提案する。
このアルゴリズムは、勾配をサンプリングし、標準のバックプロパゲーションアルゴリズムを使用することで、オブジェクトサイズに対して定義された離散的な(微分不可能な)損失関数を最小化する。
論文 参考訳(メタデータ) (2022-07-01T09:34:44Z) - Discovering Object Masks with Transformers for Unsupervised Semantic
Segmentation [75.00151934315967]
MaskDistillは教師なしセマンティックセグメンテーションのための新しいフレームワークである。
我々のフレームワークは、低レベルの画像キューにラッチを付けず、オブジェクト中心のデータセットに限らない。
論文 参考訳(メタデータ) (2022-06-13T17:59:43Z) - What You See is What You Classify: Black Box Attributions [61.998683569022006]
我々は、トレーニング済みのブラックボックス分類器であるExpplanandumの属性を予測するために、ディープネットワークであるExplainerを訓練する。
既存のほとんどのアプローチとは異なり、我々の手法はクラス固有のマスクを直接生成することができる。
我々の属性は、視覚的および定量的に確立された方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-23T12:30:04Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Semantic Segmentation In-the-Wild Without Seeing Any Segmentation
Examples [34.97652735163338]
本稿では,各オブジェクトに対するセマンティックセグメンテーションマスク作成のための新しいアプローチを提案する。
本手法は,画像に含まれるクラスカテゴリのイメージレベルラベルを入力として扱う。
このステージの出力は、教師付きメソッドが必要とする手動のピクセルレベルラベルの代わりに、ピクセルレベルの擬似ラベルを提供する。
論文 参考訳(メタデータ) (2021-12-06T17:32:38Z) - Unsupervised Image Segmentation by Mutual Information Maximization and
Adversarial Regularization [7.165364364478119]
InMARS(Information Maximization and Adrial Regularization)と呼ばれる新しい教師なしセマンティックセマンティックセマンティクス手法を提案する。
シーンを知覚群に解析する人間の知覚に触発され、提案手法はまず、入力画像を意味のある領域(スーパーピクセルとも呼ばれる)に分割する。
次に、相互情報最大化(Multual-Information-Maximization)と、それらの領域を意味論的に意味のあるクラスにクラスタ化するための敵対的トレーニング戦略を利用する。
提案手法は2つの非教師付きセマンティックセグメンテーションデータセット上での最先端性能を実現することを実証した。
論文 参考訳(メタデータ) (2021-07-01T18:36:27Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - AinnoSeg: Panoramic Segmentation with High Perfomance [4.867465475957119]
現在のパノラマセグメンテーションアルゴリズムは文脈意味論に関係しているが、画像の詳細は十分に処理されていない。
これらの課題に対処するために,本稿ではいくつかの有用なトリックを提案する。
AinnoSegと名付けられたこれらの操作はすべて、よく知られたデータセットADE20Kで最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2020-07-21T04:16:46Z) - Revisiting Sequence-to-Sequence Video Object Segmentation with
Multi-Task Loss and Skip-Memory [4.343892430915579]
ビデオオブジェクト(VOS)は、視覚領域の活発な研究領域である。
現行のアプローチでは、特にオブジェクトが小さく、あるいは一時的に隠された場合、長いシーケンスでオブジェクトを失う。
我々は,エンコーダ・デコーダアーキテクチャとメモリモジュールを組み合わせたシーケンス・ツー・シーケンス・アプローチを構築し,シーケンシャルデータを活用する。
論文 参考訳(メタデータ) (2020-04-25T15:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。