論文の概要: Label conditioned segmentation
- arxiv url: http://arxiv.org/abs/2203.10091v1
- Date: Thu, 17 Mar 2022 22:21:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-27 06:50:48.959909
- Title: Label conditioned segmentation
- Title(参考訳): ラベル条件付きセグメンテーション
- Authors: Tianyu Ma, Benjamin C. Lee, Mert R. Sabuncu
- Abstract要約: セマンティックセグメンテーションはコンピュータビジョンにおいて重要なタスクであり、畳み込みニューラルネットワーク(CNN)にしばしば取り組まれる。
複数のクラスを持つセグメンテーションタスクに対して、標準的なアプローチはマルチチャネル確率的セグメンテーションマップを計算するネットワークを使用することである。
本稿では,この課題に対処するための簡易かつ効果的な方法を提案する。
提案手法では,ネットワークの出力クラスを決定する単一クラスラベルで条件付きで単一チャネル出力を生成する。
- 参考スコア(独自算出の注目度): 14.66405859401613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation is an important task in computer vision that is often
tackled with convolutional neural networks (CNNs). A CNN learns to produce
pixel-level predictions through training on pairs of images and their
corresponding ground-truth segmentation labels. For segmentation tasks with
multiple classes, the standard approach is to use a network that computes a
multi-channel probabilistic segmentation map, with each channel representing
one class. In applications where the image grid size (e.g., when it is a 3D
volume) and/or the number of labels is relatively large, the standard
(baseline) approach can become prohibitively expensive for our computational
resources. In this paper, we propose a simple yet effective method to address
this challenge. In our approach, the segmentation network produces a
single-channel output, while being conditioned on a single class label, which
determines the output class of the network. Our method, called label
conditioned segmentation (LCS), can be used to segment images with a very large
number of classes, which might be infeasible for the baseline approach. We also
demonstrate in the experiments that label conditioning can improve the accuracy
of a given backbone architecture, likely, thanks to its parameter efficiency.
Finally, as we show in our results, an LCS model can produce previously unseen
fine-grained labels during inference time, when only coarse labels were
available during training. We provide all of our code here:
https://github.com/tym002/Label-conditioned-segmentation
- Abstract(参考訳): セマンティックセグメンテーションはコンピュータビジョンにおいて重要なタスクであり、畳み込みニューラルネットワーク(CNN)にしばしば取り組まれる。
cnnは、画像のペアと対応する地対セグメンテーションラベルのトレーニングを通じてピクセルレベルの予測を生成する。
複数のクラスを持つセグメンテーションタスクに対して、標準的なアプローチは、各チャネルが1つのクラスを表すマルチチャネル確率セグメンテーションマップを計算するネットワークを使用することである。
画像グリッドのサイズ(例えば3Dボリュームの場合)やラベルの数が比較的大きいアプリケーションでは、標準(ベースライン)アプローチは計算資源にとって違法に高価になる可能性がある。
本稿では,この課題に対処するための簡易かつ効果的な手法を提案する。
提案手法では、セグメンテーションネットワークは、ネットワークの出力クラスを決定する単一のクラスラベル上で条件付けされながら、単一チャネル出力を生成する。
label conditioned segmentation(lcs)と呼ばれるこの手法は,ベースラインアプローチでは実現不可能な,非常に多数のクラスでイメージをセグメンテーションするために使用できる。
また, ラベル条件付けにより, パラメータ効率により, 特定のバックボーンアーキテクチャの精度が向上することが実験で実証された。
最後に, 実験結果から, LCSモデルでは, トレーニング中に粗いラベルしか得られなかった場合に, 未確認の細粒度ラベルを生成できることを示した。
https://github.com/tym002/Label-conditioned-segmentation
関連論文リスト
- You Only Need One Thing One Click: Self-Training for Weakly Supervised
3D Scene Understanding [107.06117227661204]
私たちはOne Thing One Click''を提案する。つまり、アノテーションはオブジェクトごとに1つのポイントをラベル付けするだけです。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
我々のモデルは、ポイントクラスタリング戦略を備えた3Dインスタンスセグメンテーションと互換性がある。
論文 参考訳(メタデータ) (2023-03-26T13:57:00Z) - Combining Metric Learning and Attention Heads For Accurate and Efficient
Multilabel Image Classification [0.0]
マルチラベル分類における2つの一般的なアプローチについて再検討する。
トランスフォーマーベースヘッドはグラフベースのブランチよりも優れた結果が得られると考えられるが、適切なトレーニング戦略により、グラフベースの手法はわずかに精度の低下を示すことができると論じる。
論文 参考訳(メタデータ) (2022-09-14T12:06:47Z) - Distilling Ensemble of Explanations for Weakly-Supervised Pre-Training
of Image Segmentation Models [54.49581189337848]
本稿では,分類データセットに基づく画像分割モデルのエンドツーエンド事前学習を可能にする手法を提案する。
提案手法は重み付きセグメンテーション学習法を利用して,重み付きセグメンテーションネットワークを事前訓練する。
実験の結果,ImageNetにソースデータセットとしてPSSLを伴って提案されたエンドツーエンドの事前トレーニング戦略が,さまざまなセグメンテーションモデルの性能向上に成功していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T13:02:32Z) - From Explanations to Segmentation: Using Explainable AI for Image
Segmentation [1.8581514902689347]
我々は、説明可能なAI(XAI)コミュニティの進歩の上に構築し、ピクセル単位のバイナリセグメンテーションを抽出する。
我々は,既存のU-Netセグメンテーションアーキテクチャと比較して,同様の結果が得られることを示す。
トレーニングサンプルは画像レベルでのみラベル付けする必要があるため,提案手法は弱教師付きでトレーニングすることができる。
論文 参考訳(メタデータ) (2022-02-01T10:26:10Z) - Semantic Segmentation In-the-Wild Without Seeing Any Segmentation
Examples [34.97652735163338]
本稿では,各オブジェクトに対するセマンティックセグメンテーションマスク作成のための新しいアプローチを提案する。
本手法は,画像に含まれるクラスカテゴリのイメージレベルラベルを入力として扱う。
このステージの出力は、教師付きメソッドが必要とする手動のピクセルレベルラベルの代わりに、ピクセルレベルの擬似ラベルを提供する。
論文 参考訳(メタデータ) (2021-12-06T17:32:38Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - One Thing One Click: A Self-Training Approach for Weakly Supervised 3D
Semantic Segmentation [78.36781565047656]
私たちは、アノテーションーがオブジェクトごとに1ポイントだけラベルを付ける必要があることを意味する「One Thing One Click」を提案します。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
私たちの結果は、完全に監督されたものと同等です。
論文 参考訳(メタデータ) (2021-04-06T02:27:25Z) - PCAMs: Weakly Supervised Semantic Segmentation Using Point Supervision [12.284208932393073]
本稿では,ある点レベルのアノテーションが与えられた画像から意味的セグメンテーションを生成する新しい手法を提案する。
提案するCNNは,通常,地上の真理ラベルの代わりに擬似ラベルを用いて完全に教師される。
提案手法は,PASCAL VOC 2012 データセットを引用した PASCAL VOC 2012 のセマンティックセマンティックセマンティフィケーションのための技術結果の状態を達成し,より強いバウンディングボックスやリスグル管理のための技術手法よりも優れていた。
論文 参考訳(メタデータ) (2020-07-10T21:25:27Z) - Simple Interactive Image Segmentation using Label Propagation through
kNN graphs [0.0]
本稿では,非指向性と非重み付きkNNグラフを用いたSSLグラフに基づく対話型画像分割手法を提案する。
他の多くの技術よりもシンプルであるが、画像分割タスクの分類精度は依然として達成されている。
論文 参考訳(メタデータ) (2020-02-13T18:50:21Z) - RGB-based Semantic Segmentation Using Self-Supervised Depth Pre-Training [77.62171090230986]
本稿では,任意の意味的RGBセグメンテーション手法の事前学習に使用できる,スケーラブルで自己管理の容易な手法を提案する。
特に、我々の事前学習アプローチでは、深度センサーを用いて得られるラベルを自動生成する。
提案したHNラベルによる自己教師付き事前学習が,ImageNetの事前学習にどのように応用できるかを示す。
論文 参考訳(メタデータ) (2020-02-06T11:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。