論文の概要: Pseudo Pixel-level Labeling for Images with Evolving Content
- arxiv url: http://arxiv.org/abs/2105.09975v1
- Date: Thu, 20 May 2021 18:14:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 03:35:11.499218
- Title: Pseudo Pixel-level Labeling for Images with Evolving Content
- Title(参考訳): 進化するコンテンツを持つ画像に対する擬似画素レベルラベリング
- Authors: Sara Mousavi, Zhenning Yang, Kelley Cross, Dawnie Steadman, Audris
Mockus
- Abstract要約: 画像の手動アノテーションの労力を削減するために,擬似ピクセルレベルのラベル生成手法を提案する。
VGGとResNetのバックボーンを用いた2つのセマンティックセグメンテーションモデルを、擬似ラベリング法と最先端手法を用いてラベル付けした画像上で学習する。
以上の結果から, トレーニングプロセスにおいて, 最先端手法を用いて生成したデータの代わりに擬似ラベルを用いることで, VGGおよびResNetに基づくセマンティックセマンティックセグメンテーションモデルの平均IoUと周波数重み付きIoUを3.36%, 2.58%, 10倍改善することがわかった。
- 参考スコア(独自算出の注目度): 5.573543601558405
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Annotating images for semantic segmentation requires intense manual labor and
is a time-consuming and expensive task especially for domains with a scarcity
of experts, such as Forensic Anthropology. We leverage the evolving nature of
images depicting the decay process in human decomposition data to design a
simple yet effective pseudo-pixel-level label generation technique to reduce
the amount of effort for manual annotation of such images. We first identify
sequences of images with a minimum variation that are most suitable to share
the same or similar annotation using an unsupervised approach. Given one
user-annotated image in each sequence, we propagate the annotation to the
remaining images in the sequence by merging it with annotations produced by a
state-of-the-art CAM-based pseudo label generation technique. To evaluate the
quality of our pseudo-pixel-level labels, we train two semantic segmentation
models with VGG and ResNet backbones on images labeled using our pseudo
labeling method and those of a state-of-the-art method. The results indicate
that using our pseudo-labels instead of those generated using the
state-of-the-art method in the training process improves the mean-IoU and the
frequency-weighted-IoU of the VGG and ResNet-based semantic segmentation models
by 3.36%, 2.58%, 10.39%, and 12.91% respectively.
- Abstract(参考訳): セマンティックセグメンテーションのための画像の注釈は、強い手作業を必要とし、特に法医学人類学のような専門家の少ない領域では、時間と費用がかかる作業である。
我々は,人間の分解データにおける崩壊過程を表現した画像の進化的性質を活かし,簡易かつ効果的な擬似ピクセルレベルラベル生成手法を考案し,画像の手動アノテーションの労力を削減する。
まず、教師なしのアプローチで、同一または類似のアノテーションを共有するのに最も適した最小のバリエーションを持つ画像のシーケンスを識別する。
各シーケンスに1つのユーザ・アノテートされた画像が与えられた場合、最新のCAMベースの擬似ラベル生成技術によって生成されたアノテーションと組み合わせることで、残りの画像にアノテーションを伝達する。
擬似画素レベルのラベルの品質を評価するため,VGGとResNetのバックボーンを用いた2つのセマンティックセグメンテーションモデルを擬似ラベリング法と最先端手法を用いて学習した。
その結果,VGGとResNetに基づくセマンティックセグメンテーションモデルの平均IoUと周波数重み付きIoUをそれぞれ3.36%,2.58%,10.39%,12.91%改善した。
関連論文リスト
- Distilling Self-Supervised Vision Transformers for Weakly-Supervised
Few-Shot Classification & Segmentation [58.03255076119459]
視覚変換器(ViT)を利用した弱教師付き小ショット画像分類とセグメンテーションの課題に対処する。
提案手法は,自己監督型ViTからトークン表現を抽出し,その相関関係を利用して分類とセグメンテーションの予測を行う。
Pascal-5iとCOCO-20iの実験は、様々な監視設定において大きなパフォーマンス向上を示した。
論文 参考訳(メタデータ) (2023-07-07T06:16:43Z) - Learning to Annotate Part Segmentation with Gradient Matching [58.100715754135685]
本稿では,事前学習したGANを用いて,高品質な画像を生成することで,半教師付き部分分割タスクに対処することに焦点を当てる。
特に、アノテータ学習を学習から学習までの問題として定式化する。
提案手法は,実画像,生成された画像,さらには解析的に描画された画像を含む,幅広いラベル付き画像からアノテータを学習可能であることを示す。
論文 参考訳(メタデータ) (2022-11-06T01:29:22Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Reference-guided Pseudo-Label Generation for Medical Semantic
Segmentation [25.76014072179711]
本稿では,半教師付きセマンティックセグメンテーションのための管理手法を提案する。
少数のラベル付き画像を参照材料として使用し、未ラベル画像中の画素と参照集合内の最適な画素のセマンティクスを一致させる。
我々は,X線解剖学的セグメンテーションにおける標準完全教師付きモデルと同じ性能を達成するが,ラベル付き画像の95%は少ない。
論文 参考訳(メタデータ) (2021-12-01T12:21:24Z) - Self-supervised Product Quantization for Deep Unsupervised Image
Retrieval [21.99902461562925]
改良されたディープラーニングベースのハッシュとベクトル量子化は、高速で大規模な画像検索システムを実現する。
本稿では,SPQ (Self-supervised Product Quantization) ネットワークと呼ばれる,ラベルフリーで,自己教師型で訓練された画像検索手法を提案する。
提案手法は,画像内容を分析して記述的特徴を抽出し,正確な検索のための画像表現の理解を可能にする。
論文 参考訳(メタデータ) (2021-09-06T05:02:34Z) - Self-Ensembling Contrastive Learning for Semi-Supervised Medical Image
Segmentation [6.889911520730388]
限られたラベルを持つ医用画像セグメンテーションにおける半教師あり学習の性能向上を目指す。
我々は、ラベルのない画像に対照的な損失を与えることによって、特徴レベルで潜在表現を直接学習する。
我々はMRIとCTのセグメンテーションデータセットの実験を行い、提案手法が最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-05-27T03:27:58Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Automatic Image Labelling at Pixel Level [21.59653873040243]
画素レベルの画像ラベリングを自動的に生成する興味深い学習手法を提案する。
The Guided Filter Network (GFN) was first developed to learn the segmentation knowledge from a source domain。
GFNはそのようなセグメンテーションの知識を変換し、ターゲットドメインで粗いオブジェクトマスクを生成する。
論文 参考訳(メタデータ) (2020-07-15T00:34:11Z) - RGB-based Semantic Segmentation Using Self-Supervised Depth Pre-Training [77.62171090230986]
本稿では,任意の意味的RGBセグメンテーション手法の事前学習に使用できる,スケーラブルで自己管理の容易な手法を提案する。
特に、我々の事前学習アプローチでは、深度センサーを用いて得られるラベルを自動生成する。
提案したHNラベルによる自己教師付き事前学習が,ImageNetの事前学習にどのように応用できるかを示す。
論文 参考訳(メタデータ) (2020-02-06T11:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。