論文の概要: Bayesian Active Learning for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2408.01694v1
- Date: Sat, 3 Aug 2024 07:26:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 18:51:05.676672
- Title: Bayesian Active Learning for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのためのベイズアクティブラーニング
- Authors: Sima Didari, Wenjun Hu, Jae Oh Woo, Heng Hao, Hankyu Moon, Seungjai Min,
- Abstract要約: スパースピクセルレベルのアノテーションに基づくベイズ能動的学習フレームワークを提案する。
BalEntは、予測された限界化確率分布とピクセルラベルの間の情報をキャプチャする。
私たちは、Cityscapes、Camvid、ADE20K、VOC2012ベンチマークデータセットのために提案したアクティブラーニングフレームワークをトレーニングします。
- 参考スコア(独自算出の注目度): 9.617769135242973
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Fully supervised training of semantic segmentation models is costly and challenging because each pixel within an image needs to be labeled. Therefore, the sparse pixel-level annotation methods have been introduced to train models with a subset of pixels within each image. We introduce a Bayesian active learning framework based on sparse pixel-level annotation that utilizes a pixel-level Bayesian uncertainty measure based on Balanced Entropy (BalEnt) [84]. BalEnt captures the information between the models' predicted marginalized probability distribution and the pixel labels. BalEnt has linear scalability with a closed analytical form and can be calculated independently per pixel without relational computations with other pixels. We train our proposed active learning framework for Cityscapes, Camvid, ADE20K and VOC2012 benchmark datasets and show that it reaches supervised levels of mIoU using only a fraction of labeled pixels while outperforming the previous state-of-the-art active learning models with a large margin.
- Abstract(参考訳): 画像内の各ピクセルにラベルを付ける必要があるため、セマンティックセグメンテーションモデルの完全な教師付きトレーニングは費用がかかる。
そのため、各画像内に画素のサブセットを持つモデルを訓練するために、スパースピクセルレベルのアノテーション手法が導入されている。
平衡エントロピー(BalEnt) [84] に基づく画素レベルのベイズ不確実性尺度を用いた,スパースピクセルレベルのアノテーションに基づくベイズ能動学習フレームワークを提案する。
BalEntは、予測された限界化確率分布とピクセルラベルの間の情報をキャプチャする。
BalEntは、解析形式が閉じた線形スケーラビリティを持ち、他のピクセルとのリレーショナルな計算をすることなく、ピクセル毎に独立に計算することができる。
提案したアクティブラーニングフレームワークを,Cityscapes,Camvid,ADE20K,VOC2012ベンチマークデータセット向けにトレーニングし,ラベル付きピクセルのごく一部を使用してmIoUの教師付きレベルに達するとともに,従来の最先端のアクティブラーニングモデルよりも大きなマージンを持つことを示す。
関連論文リスト
- FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models [56.71672127740099]
我々は,閉鎖語彙データセットのトレーニングモデルによって伝統的に解決されるイメージセグメンテーションの課題に焦点をあてる。
我々は、ゼロショットのオープン語彙セグメンテーションのために、異なる、比較的小さなオープンソース基盤モデルを活用している。
当社のアプローチ(別名FreeSeg-Diff)は、トレーニングに依存しないもので、Pascal VOCとCOCOデータセットの両方で多くのトレーニングベースのアプローチより優れています。
論文 参考訳(メタデータ) (2024-03-29T10:38:25Z) - Semi-supervised Counting via Pixel-by-pixel Density Distribution
Modelling [135.66138766927716]
本稿では,トレーニングデータのごく一部をラベル付けした半教師付き群集カウントに着目した。
我々は1つの決定論的値ではなく、確率分布として回帰するためにピクセル単位の密度値を定式化する。
本手法は,様々なラベル付き比率設定の下で,競争相手よりも明らかに優れる。
論文 参考訳(メタデータ) (2024-02-23T12:48:02Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - NP-SemiSeg: When Neural Processes meet Semi-Supervised Semantic
Segmentation [87.50830107535533]
半教師付きセマンティックセグメンテーションでは、トレーニング時にピクセルワイズラベルをラベル付けされていない画像に割り当てる。
モデルによるクラスワイズ確率分布から各画素の擬似ラベルを予測し,半教師付きセマンティックセマンティックセマンティクスへのアプローチ
本研究では,NPを半教師付きセマンティックセグメンテーションに適応させることにより一歩前進し,NP-SemiSegと呼ばれる新しいモデルを実現する。
論文 参考訳(メタデータ) (2023-08-05T12:42:15Z) - Residual Pattern Learning for Pixel-wise Out-of-Distribution Detection
in Semantic Segmentation [38.784135463275305]
本稿では,新たな残差パターン学習 (RPL) モジュールを提案する。このモジュールはセグメンテーションモデルを用いて,イリヤセグメンテーション性能に影響を与えることなく,OoD画素の検出を支援する。
また,様々な文脈において,RPLがOoD画素を頑健に検出することを強制する新しいコンテクストロバストコントラスト学習(CoroCL)を提案する。
われわれのアプローチは、FPRが約10%改善し、AuPRCが7%向上し、フィッシュスケープ、Segment-Me-If-You-Can、RoadAnomalyデータセットの最先端になった。
論文 参考訳(メタデータ) (2022-11-26T08:32:28Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Class Balanced PixelNet for Neurological Image Segmentation [20.56747443955369]
画素レベルの畳み込みニューラルネットワーク(CNN)を用いた自動脳腫瘍分割法(PixelNetなど)を提案する。
提案モデルは脳腫瘍と虚血性脳梗塞のセグメンテーションデータセットにおいて有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-23T10:57:54Z) - Mining Contextual Information Beyond Image for Semantic Segmentation [37.783233906684444]
セマンティックイメージセグメンテーションにおける文脈集約問題について検討する。
個々の画像以外の文脈情報をマイニングして、ピクセル表現をさらに強化することを提案する。
提案手法は,既存のセグメンテーションフレームワークに強制的に組み込むことができる。
論文 参考訳(メタデータ) (2021-08-26T14:34:23Z) - All you need are a few pixels: semantic segmentation with PixelPick [30.234492042103966]
そこで本研究では,十分なセグメンテーション性能を達成するためには,いくつかの精細なピクセルラベルだけでよいことを示す。
我々は,この現象をpixelpickと呼ばれるアクティブ学習フレームワークで活用し,ラベリングコストを劇的に削減する方法を実証する。
論文 参考訳(メタデータ) (2021-04-13T17:55:33Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Deep Active Learning for Joint Classification & Segmentation with Weak
Annotator [22.271760669551817]
クラスアクティベーションマップ(CAM)のようなCNNの可視化と解釈手法は、一般的に、クラス予測に関連する画像領域を強調するために使用される。
本稿では,画素レベルのアノテーションを段階的に統合する能動的学習フレームワークを提案する。
提案手法は, ランダムなサンプル選択を用いることで, 最先端のCAMやAL手法よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2020-10-10T03:25:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。