論文の概要: Automatic Image Labelling at Pixel Level
- arxiv url: http://arxiv.org/abs/2007.07415v2
- Date: Mon, 20 Jul 2020 03:17:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 05:44:28.387306
- Title: Automatic Image Labelling at Pixel Level
- Title(参考訳): 画素レベルでの自動画像ラベリング
- Authors: Xiang Zhang, Wei Zhang, Jinye Peng, Jianping Fan
- Abstract要約: 画素レベルの画像ラベリングを自動的に生成する興味深い学習手法を提案する。
The Guided Filter Network (GFN) was first developed to learn the segmentation knowledge from a source domain。
GFNはそのようなセグメンテーションの知識を変換し、ターゲットドメインで粗いオブジェクトマスクを生成する。
- 参考スコア(独自算出の注目度): 21.59653873040243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of deep networks for semantic image segmentation largely
depends on the availability of large-scale training images which are labelled
at the pixel level. Typically, such pixel-level image labellings are obtained
manually by a labour-intensive process. To alleviate the burden of manual image
labelling, we propose an interesting learning approach to generate pixel-level
image labellings automatically. A Guided Filter Network (GFN) is first
developed to learn the segmentation knowledge from a source domain, and such
GFN then transfers such segmentation knowledge to generate coarse object masks
in the target domain. Such coarse object masks are treated as pseudo labels and
they are further integrated to optimize/refine the GFN iteratively in the
target domain. Our experiments on six image sets have demonstrated that our
proposed approach can generate fine-grained object masks (i.e., pixel-level
object labellings), whose quality is very comparable to the manually-labelled
ones. Our proposed approach can also achieve better performance on semantic
image segmentation than most existing weakly-supervised approaches.
- Abstract(参考訳): セマンティックイメージセグメンテーションのためのディープネットワークの性能は、ピクセルレベルでラベル付けされた大規模トレーニングイメージの可用性に大きく依存する。
通常、そのようなピクセルレベルの画像ラベリングは、労働集約プロセスによって手動で得られる。
手動画像ラベリングの負担を軽減するため,画素レベルの画像ラベリングを自動的に生成する興味深い学習手法を提案する。
誘導フィルタネットワーク(gfn)は、まず、ソースドメインからセグメンテーション知識を学習するために開発され、その後、そのようなセグメンテーション知識を転送して対象ドメイン内の粗いオブジェクトマスクを生成する。
このような粗いオブジェクトマスクは擬似ラベルとして扱われ、ターゲットドメインで反復的にgfnを最適化/再定義するためにさらに統合される。
6つの画像集合に対する実験により,提案手法により,手作業による被写体に非常に匹敵する微細な被写体マスク(ピクセルレベルの被写体ラベル)を生成できることが実証された。
提案手法は,既存の弱教師付きアプローチよりもセマンティックイメージセグメンテーションの性能が向上する。
関連論文リスト
- Towards Open-Vocabulary Semantic Segmentation Without Semantic Labels [53.8817160001038]
画素レベルの理解にCLIP画像エンコーダを適用する新しい手法であるPixelCLIPを提案する。
セマンティックラベルを使わずにマスクを活用するという課題に対処するため,オンラインクラスタリングアルゴリズムを考案した。
PixelCLIPはCLIPよりも大幅にパフォーマンスが向上し、キャプション管理手法に比べて競合性が向上した。
論文 参考訳(メタデータ) (2024-09-30T01:13:03Z) - Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.09251327650334]
セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。
提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文 参考訳(メタデータ) (2023-09-11T14:32:04Z) - Unified Mask Embedding and Correspondence Learning for Self-Supervised
Video Segmentation [76.40565872257709]
我々は、局所的な識別的特徴学習のためのフレーム間密度対応を同時にモデル化する統合フレームワークを開発する。
ラベルなしビデオから直接マスク誘導シーケンシャルセグメンテーションを実行することができる。
我々のアルゴリズムは、2つの標準ベンチマーク(DAVIS17とYouTube-VOS)に最先端をセットする。
論文 参考訳(メタデータ) (2023-03-17T16:23:36Z) - ReFit: A Framework for Refinement of Weakly Supervised Semantic
Segmentation using Object Border Fitting for Medical Images [4.945138408504987]
Weakly Supervised Semantic (WSSS)は、画像レベルの監視のみに依存しているため、ネットワークの必要性に対処する上で有望なアプローチである。
本稿では,最新クラスのアクティベーションマップとポストプロセッシング手法を組み合わせたReFitフレームワークを提案する。
本手法をWSSS予測に適用することにより,医用画像の最先端WSSS法に対して最大10%の改善を実現した。
論文 参考訳(メタデータ) (2023-03-14T12:46:52Z) - CoupAlign: Coupling Word-Pixel with Sentence-Mask Alignments for
Referring Image Segmentation [104.5033800500497]
画像セグメント化の参照は、自然言語文で記述された視覚オブジェクトのすべてのピクセルをローカライズすることを目的としている。
以前の作業では、参照オブジェクトをハイライトするために、文章の埋め込みとピクセルレベルの埋め込みを簡単に調整することを学びました。
単純で効果的なマルチレベル視覚系列アライメント法であるCoupAlignを提案する。
論文 参考訳(メタデータ) (2022-12-04T08:53:42Z) - From Explanations to Segmentation: Using Explainable AI for Image
Segmentation [1.8581514902689347]
我々は、説明可能なAI(XAI)コミュニティの進歩の上に構築し、ピクセル単位のバイナリセグメンテーションを抽出する。
我々は,既存のU-Netセグメンテーションアーキテクチャと比較して,同様の結果が得られることを示す。
トレーニングサンプルは画像レベルでのみラベル付けする必要があるため,提案手法は弱教師付きでトレーニングすることができる。
論文 参考訳(メタデータ) (2022-02-01T10:26:10Z) - Aerial Scene Parsing: From Tile-level Scene Classification to Pixel-wise
Semantic Labeling [48.30060717413166]
航空画像が与えられた場合、空中シーン解析(ASP)は、画像の各ピクセルにセマンティックラベルを割り当てることで、画像内容の意味構造を解釈する。
本稿では,Mario-AIDと呼ばれる100万件の航空画像を含む大規模シーン分類データセットを提案する。
また,古典的畳み込みニューラルネットワーク(CNN)を用いたベンチマーク実験を行い,ピクセルワイドなセマンティックラベリングを実現する。
論文 参考訳(メタデータ) (2022-01-06T07:40:47Z) - GANSeg: Learning to Segment by Unsupervised Hierarchical Image
Generation [16.900404701997502]
本稿では,潜伏マスクに条件付き画像を生成するGANベースのアプローチを提案する。
このようなマスク条件の画像生成は、マスクを階層的に条件付ける際に忠実に学習できることを示す。
また、セグメンテーションネットワークをトレーニングするためのイメージマスクペアの生成も可能で、既存のベンチマークでは、最先端の教師なしセグメンテーションメソッドよりも優れています。
論文 参考訳(メタデータ) (2021-12-02T07:57:56Z) - Maximize the Exploration of Congeneric Semantics for Weakly Supervised
Semantic Segmentation [27.155133686127474]
グラフニューラルネットワーク(P-GNN)を,同一のクラスラベルを含む異なる画像からの自己検出パッチに基づいて構築する。
PASCAL VOC 2012ベンチマークで実験を行い、そのモデルにより最先端の性能が得られた。
論文 参考訳(メタデータ) (2021-10-08T08:59:16Z) - Pseudo Pixel-level Labeling for Images with Evolving Content [5.573543601558405]
画像の手動アノテーションの労力を削減するために,擬似ピクセルレベルのラベル生成手法を提案する。
VGGとResNetのバックボーンを用いた2つのセマンティックセグメンテーションモデルを、擬似ラベリング法と最先端手法を用いてラベル付けした画像上で学習する。
以上の結果から, トレーニングプロセスにおいて, 最先端手法を用いて生成したデータの代わりに擬似ラベルを用いることで, VGGおよびResNetに基づくセマンティックセマンティックセグメンテーションモデルの平均IoUと周波数重み付きIoUを3.36%, 2.58%, 10倍改善することがわかった。
論文 参考訳(メタデータ) (2021-05-20T18:14:19Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。