論文の概要: Learning to segment from object sizes
- arxiv url: http://arxiv.org/abs/2207.00289v1
- Date: Fri, 1 Jul 2022 09:34:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 21:23:30.622799
- Title: Learning to segment from object sizes
- Title(参考訳): オブジェクトサイズからセグメントを学習する
- Authors: Denis Baru\v{c}i\'c (1), Jan Kybic (1) ((1) Czech Technical University
in Prague, Czech Republic)
- Abstract要約: 本稿では,数画素の注釈付き画像と既知のオブジェクトサイズを持つ多数の画像のデータセットから,ディープセグメンテーションネットワークをトレーニングするアルゴリズムを提案する。
このアルゴリズムは、勾配をサンプリングし、標準のバックプロパゲーションアルゴリズムを使用することで、オブジェクトサイズに対して定義された離散的な(微分不可能な)損失関数を最小化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has proved particularly useful for semantic segmentation, a
fundamental image analysis task. However, the standard deep learning methods
need many training images with ground-truth pixel-wise annotations, which are
usually laborious to obtain and, in some cases (e.g., medical images), require
domain expertise. Therefore, instead of pixel-wise annotations, we focus on
image annotations that are significantly easier to acquire but still
informative, namely the size of foreground objects. We define the object size
as the maximum distance between a foreground pixel and the background. We
propose an algorithm for training a deep segmentation network from a dataset of
a few pixel-wise annotated images and many images with known object sizes. The
algorithm minimizes a discrete (non-differentiable) loss function defined over
the object sizes by sampling the gradient and then using the standard
back-propagation algorithm. We study the performance of our approach in terms
of training time and generalization error.
- Abstract(参考訳): ディープラーニングは、画像解析の基本的なタスクであるセマンティックセグメンテーションに特に有用であることが証明されている。
しかし、標準的なディープラーニング手法は、通常取得に苦労し、場合によっては(医学的画像など)ドメインの専門知識を必要とする、基礎となるピクセル単位のアノテーションを持つ多くのトレーニング画像を必要とする。
したがって、ピクセル単位でのアノテーションではなく、画像のアノテーションに焦点をあてます。
我々は、オブジェクトサイズを、前景画素と背景の間の最大距離として定義する。
本稿では,数画素の注釈付き画像と既知のオブジェクトサイズを持つ多数の画像のデータセットから,ディープセグメンテーションネットワークをトレーニングするアルゴリズムを提案する。
このアルゴリズムは、勾配をサンプリングし、標準のバックプロパゲーションアルゴリズムを使用して、オブジェクトサイズ上で定義される離散的(非微分可能)損失関数を最小化する。
トレーニング時間と一般化誤差の観点から,本手法の性能について検討する。
関連論文リスト
- Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.09251327650334]
セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。
提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文 参考訳(メタデータ) (2023-09-11T14:32:04Z) - Beyond pixel-wise supervision for segmentation: A few global shape
descriptors might be surprisingly good! [16.293620755563854]
ディープセグメンテーションネットワークを訓練するための標準的な損失は、予測されたセグメンテーションのグローバル形状を監督する代わりに、ピクセルの個別の分類と見なすことができる。
本研究では,深層ネットワークの学習におけるセグメンテーション損失として使用する場合,グローバル幾何形状記述子の有効性について検討する。
論文 参考訳(メタデータ) (2021-05-03T13:44:36Z) - Sparse Object-level Supervision for Instance Segmentation with Pixel
Embeddings [4.038011160363972]
ほとんどの最先端のインスタンスセグメンテーションメソッドは、密接な注釈付き画像でトレーニングする必要があります。
非空間埋め込みに基づく提案フリーセグメンテーション手法を提案する。
本研究では, 異なる顕微鏡モードにおける2次元および3次元分割問題の解法について検討した。
論文 参考訳(メタデータ) (2021-03-26T16:36:56Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Exploring Cross-Image Pixel Contrast for Semantic Segmentation [130.22216825377618]
完全教師付きセッティングにおけるセマンティックセグメンテーションのための画素単位のコントラストフレームワークを提案する。
中心となる考え方は、同じセマンティッククラスに属するピクセルの埋め込みを、異なるクラスの埋め込みよりもよく似ているように強制することである。
テスト中に余分なオーバーヘッドを伴わずに既存のセグメンテーションフレームワークに懸命に組み込むことができる。
論文 参考訳(メタデータ) (2021-01-28T11:35:32Z) - Rethinking of the Image Salient Object Detection: Object-level Semantic
Saliency Re-ranking First, Pixel-wise Saliency Refinement Latter [62.26677215668959]
本稿では,意味的に有意な領域を粗い位置で特定する,軽量で教師付きの深層ネットワークを提案する。
次に,これらセマンティック・サリエント領域の深層モデルを画素ワイド・サリエンシ改善として融合する。
提案手法は単純だが有効であり,本手法は主眼をオブジェクトレベルのセマンティック・リグレード問題とみなすための最初の試みである。
論文 参考訳(メタデータ) (2020-08-10T07:12:43Z) - Learning RGB-D Feature Embeddings for Unseen Object Instance
Segmentation [67.88276573341734]
合成データからRGB-D特徴埋め込みを学習し,オブジェクトのインスタンスセグメンテーションを未確認する手法を提案する。
距離学習損失関数を用いて画素単位の機能埋め込みを学習する。
新たな2段階クラスタリングアルゴリズムにより,セグメンテーションの精度をさらに向上する。
論文 参考訳(メタデータ) (2020-07-30T00:23:07Z) - Multi-task deep learning for image segmentation using recursive
approximation tasks [5.735162284272276]
セグメンテーションのためのディープニューラルネットワークは通常、手作業で作成するのに高価な大量のピクセルレベルのラベルを必要とする。
本研究では,この制約を緩和するマルチタスク学習手法を提案する。
ネットワークは、非常に少量の精度で区切られた画像と大量の粗いラベルで訓練されている。
論文 参考訳(メタデータ) (2020-05-26T21:35:26Z) - Reinforced Coloring for End-to-End Instance Segmentation [10.73460247817528]
本稿では,複数の物体を並列に区別する方法を学習する,反復的深層強化学習エージェントを提案する。
トレーニング可能なエージェントに対する報酬関数は、グラフカラー化アルゴリズムを用いて、同じオブジェクトに属するピクセルをグループ化することを好んで設計する。
論文 参考訳(メタデータ) (2020-05-14T15:15:47Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。