論文の概要: Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2208.09910v2
- Date: Sun, 26 Mar 2023 07:10:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 02:54:10.367897
- Title: Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic
Segmentation
- Title(参考訳): 半監督セマンティックセマンティックセグメンテーションにおける弱-ストロング整合性の再検討
- Authors: Lihe Yang, Lei Qi, Litong Feng, Wayne Zhang, Yinghuan Shi
- Abstract要約: Wevisit the weak-to-strong consistency framework popular by FixMatch from semi-supervised classification。
本稿では,補助的特徴摂動流を補足として提案し,拡張された摂動空間を創出する。
我々のUnified Dual-Stream Perturbationsアプローチ(UniMatch)は、すべての評価プロトコルで既存のメソッドをはるかに上回っています。
- 参考スコア(独自算出の注目度): 27.831267434546024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we revisit the weak-to-strong consistency framework,
popularized by FixMatch from semi-supervised classification, where the
prediction of a weakly perturbed image serves as supervision for its strongly
perturbed version. Intriguingly, we observe that such a simple pipeline already
achieves competitive results against recent advanced works, when transferred to
our segmentation scenario. Its success heavily relies on the manual design of
strong data augmentations, however, which may be limited and inadequate to
explore a broader perturbation space. Motivated by this, we propose an
auxiliary feature perturbation stream as a supplement, leading to an expanded
perturbation space. On the other, to sufficiently probe original image-level
augmentations, we present a dual-stream perturbation technique, enabling two
strong views to be simultaneously guided by a common weak view. Consequently,
our overall Unified Dual-Stream Perturbations approach (UniMatch) surpasses all
existing methods significantly across all evaluation protocols on the Pascal,
Cityscapes, and COCO benchmarks. Its superiority is also demonstrated in remote
sensing interpretation and medical image analysis. We hope our reproduced
FixMatch and our results can inspire more future works. Code and logs are
available at https://github.com/LiheYoung/UniMatch.
- Abstract(参考訳): 本研究では,弱摂動画像の予測が強摂動画像の監視に役立ち,半教師付き分類のフィクスマッチによって一般化された弱対強一貫性フレームワークを再考する。
興味深いことに、このような単純なパイプラインは、セグメント化シナリオに移行する際に、最近の先進的な作業に対してすでに競合的な結果が得られる。
しかし、その成功は強いデータ拡張のマニュアル設計に大きく依存しており、より広い摂動空間を探索するには限定的で不十分である可能性がある。
そこで我々は,補助的特徴摂動流を補足として提案し,拡張された摂動空間を創出する。
一方,オリジナル画像レベルの拡張を十分に調査するために,2つの強い視点を同時に共通の弱視点で導く2つの流れ摂動手法を提案する。
その結果、我々のUnified Dual-Stream Perturbations(UniMatch)アプローチは、Pascal、Cityscapes、COCOベンチマーク上のすべての評価プロトコルにおいて、既存のすべてのメソッドを大幅に上回っている。
リモートセンシングの解釈や医用画像解析でもその優位性が示されている。
私たちは、再現されたフィクスマッチと結果が、今後の作業に刺激を与えてくれることを望んでいます。
コードとログはhttps://github.com/LiheYoung/UniMatch.comで入手できる。
関連論文リスト
- AttenScribble: Attentive Similarity Learning for Scribble-Supervised
Medical Image Segmentation [5.8447004333496855]
本稿では,単純かつ効果的なスクリブル教師あり学習フレームワークを提案する。
我々は、任意の完全畳み込みネットワーク(FCN)バックボーンの内部特徴層の上に、接続可能な空間自己アテンションモジュールを作成する。
この注意深い類似性は、セグメンテーション予測と視覚親和性の一貫性を課する新たな正規化損失をもたらす。
論文 参考訳(メタデータ) (2023-12-11T18:42:18Z) - Disentangled Representation Learning with Transmitted Information
Bottleneck [73.0553263960709]
textbfDisTIB (textbfTransmitted textbfInformation textbfBottleneck for textbfDisd representation learning) は情報圧縮と保存のバランスを保った新しい目的である。
論文 参考訳(メタデータ) (2023-11-03T03:18:40Z) - Prompting Diffusion Representations for Cross-Domain Semantic
Segmentation [101.04326113360342]
拡散事前学習は、セマンティックセグメンテーションのための並外れた領域一般化結果を達成する。
本研究では,シーンプロンプトとプロンプトランダム化戦略を導入し,セグメンテーションヘッドを訓練する際に,ドメイン不変情報をさらに混乱させる。
論文 参考訳(メタデータ) (2023-07-05T09:28:25Z) - ConMatch: Semi-Supervised Learning with Confidence-Guided Consistency
Regularization [26.542718087103665]
本稿では,ConMatchと呼ばれる擬似ラベルの信頼度によって重み付けされた画像の2つの強化されたビューから,モデルの予測間の一貫性の正則化をインテリジェントに活用する,新しい半教師付き学習フレームワークを提案する。
提案手法に対するConMatchの有効性を実証する実験を行い,広範囲にわたるアブレーション研究を行った。
論文 参考訳(メタデータ) (2022-08-18T04:37:50Z) - Consistency Regularization for Deep Face Anti-Spoofing [69.70647782777051]
顔認証システムでは、顔認証(FAS)が重要な役割を担っている。
このエキサイティングな観察によって、異なる視点の特徴整合性を促進することが、FASモデルを促進するための有望な方法かもしれないと推測する。
FASにおけるEPCR(Embeddding-level and Prediction-level Consistency Regularization)とEPCR(Embeddding-level Consistency Regularization)を併用した。
論文 参考訳(メタデータ) (2021-11-24T08:03:48Z) - Mixed-supervised segmentation: Confidence maximization helps knowledge
distillation [24.892332859630518]
本研究では,ディープニューラルネットワークのためのデュアルブランチアーキテクチャを提案する。
上枝(教師)は強い注釈を受け、下枝(学生)は限られた監督によって駆動され、上枝が指導する。
エントロピーとKLの発散の相乗効果は性能を著しく向上させることを示した。
論文 参考訳(メタデータ) (2021-09-21T20:06:13Z) - Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance
Video [128.41392860714635]
Weakly-Supervised Snoma-Temporally Detection (WSSTAD) を監視ビデオに導入する。
WSSTADは異常事象を封止する時空間管(すなわち連続する境界ボックスのシーケンス)をローカライズすることを目的としている。
本稿では,空間的・時間的領域に複数粒度を持つ入力提案を行うデュアルブランチネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:11:14Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Teach me to segment with mixed supervision: Confident students become
masters [27.976487552313113]
ディープセグメンテーションニューラルネットワークは、ピクセル単位のセグメンテーションを持つ大規模なトレーニングデータセットを必要とする。
本稿では,上枝(教師)が強いアノテーションを受け取り,下枝(学生)が限られた監督によって駆動され,上枝が指導する二重ブランチアーキテクチャを提案する。
本手法は,混合スーパービジョンフレームワークにおけるセマンティクスセグメンテーションに取り組むための他の戦略を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-12-15T02:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。