論文の概要: Knowledge Consultation for Semi-Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2503.10693v1
- Date: Wed, 12 Mar 2025 04:32:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:06:10.309805
- Title: Knowledge Consultation for Semi-Supervised Semantic Segmentation
- Title(参考訳): 半監督セマンティックセグメンテーションのための知識相談
- Authors: Thuan Than, Nhat-Anh Nguyen-Dang, Dung Nguyen, Salwa K. Al Khatib, Ahmed Elhagry, Hai Phan, Yihui He, Zhiqiang Shen, Marios Savvides, Dang Huynh,
- Abstract要約: この研究はCross Pseudo Supervisionを再考し、セグメンテーション性能をさらに高めるための知識コンサルティング(SegKC)を導入している。
提案されたSegKCは、PascalとCityscapesのベンチマークにおいて、mIoUスコアが87.1%、89.2%、89.8%がPascal VOCでそれぞれ1/4、1/2、フルスプリットパーティションでそれぞれ大幅に改善されている。
- 参考スコア(独自算出の注目度): 31.878359319061992
- License:
- Abstract: Semi-Supervised Semantic Segmentation reduces reliance on extensive annotations by using unlabeled data and state-of-the-art models to improve overall performance. Despite the success of deep co-training methods, their underlying mechanisms remain underexplored. This work revisits Cross Pseudo Supervision with dual heterogeneous backbones and introduces Knowledge Consultation (SegKC) to further enhance segmentation performance. The proposed SegKC achieves significant improvements on Pascal and Cityscapes benchmarks, with mIoU scores of 87.1%, 89.2%, and 89.8% on Pascal VOC with the 1/4, 1/2, and full split partition, respectively, while maintaining a compact model architecture.
- Abstract(参考訳): 半教師付きセマンティックセグメンテーションは、ラベルのないデータと最先端のモデルを使用して、全体的なパフォーマンスを改善することによって、広範囲なアノテーションへの依存を減らす。
ディープコトレーニング手法の成功にもかかわらず、その基盤となるメカニズムはいまだ解明されていない。
この研究はCross Pseudo Supervisionを再考し、セグメンテーション性能をさらに高めるための知識コンサルティング(SegKC)を導入している。
提案されたSegKCはPascalとCityscapesのベンチマークを大幅に改善し、mIoUスコアは87.1%、89.2%、89.8%がPascal VOCでそれぞれ1/4、1/2、およびフルスプリットパーティションで、コンパクトなモデルアーキテクチャを維持している。
関連論文リスト
- Affinity-Graph-Guided Contractive Learning for Pretext-Free Medical Image Segmentation with Minimal Annotation [55.325956390997]
本稿では,医用画像セグメンテーションのための親和性グラフ誘導半教師付きコントラスト学習フレームワーク(Semi-AGCL)を提案する。
このフレームワークは、まず、ロバストな初期特徴空間を提供する平均パッチエントロピー駆動のパッチ間サンプリング法を設計する。
完全アノテーションセットの10%に過ぎず, 完全注釈付きベースラインの精度にアプローチし, 限界偏差は2.52%に過ぎなかった。
論文 参考訳(メタデータ) (2024-10-14T10:44:47Z) - A Simple and Generalist Approach for Panoptic Segmentation [57.94892855772925]
本稿では,深部エンコーダ-浅部デコーダアーキテクチャに基づく簡易な一般化フレームワークを提案する。
これはトレーニング中の不均衡に起因することを示し、その削減のための新しい方法を提案する。
提案手法は,MS-COCOデータセット上で55.1のPQを実現する。
論文 参考訳(メタデータ) (2024-08-29T13:02:12Z) - Multi-Scale Semantic Segmentation with Modified MBConv Blocks [29.026787888644474]
セマンティックセグメンテーションに適したMBConvブロックの新規適応を導入する。
これらの変更を実装することで、Cityscapesのテストおよび検証データセットにおいて、IoU(Intersection over Union)の84.5%と84.0%という印象的な平均値が得られる。
論文 参考訳(メタデータ) (2024-02-07T07:01:08Z) - Diverse Cotraining Makes Strong Semi-Supervised Segmentor [23.000537236910905]
我々は、複数の互換性と条件付き独立なビューという、協調学習をサポートするコア仮定を再考する。
現在のコトレーニングモデルのほとんどは密結合であり、この仮定に違反している。
我々のDiverse Co-trainingは、異なる評価プロトコル間で大きなマージンで最先端のSOTA(State-of-the-art)手法より優れています。
論文 参考訳(メタデータ) (2023-08-18T03:46:29Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - UCC: Uncertainty guided Cross-head Co-training for Semi-Supervised
Semantic Segmentation [2.6324267940354655]
半教師付きセマンティックセグメンテーションのための新しい学習フレームワークUncertainty Guided Cross-head Co-training(UCC)を提案する。
当社のフレームワークでは,共有エンコーダ内の弱体化と強体化を導入して,一貫性と自己学習のメリットを自然に組み合わせたコトレーニングを実現している。
我々の手法は、最先端の半教師付きセマンティックセグメンテーション法よりもはるかに優れている。
論文 参考訳(メタデータ) (2022-05-20T17:43:47Z) - Scaling up Multi-domain Semantic Segmentation with Sentence Embeddings [81.09026586111811]
ゼロショット設定に適用した場合、最先端の教師付き性能を実現するセマンティックセマンティックセマンティクスへのアプローチを提案する。
これは各クラスラベルを、クラスを記述する短い段落のベクトル値の埋め込みに置き換えることによって達成される。
結果として得られた200万以上の画像の統合セマンティックセグメンテーションデータセットは、7つのベンチマークデータセット上の最先端の教師付きメソッドと同等のパフォーマンスを達成するモデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2022-02-04T07:19:09Z) - Weakly Supervised Semantic Segmentation by Pixel-to-Prototype Contrast [43.40192909920495]
クロスビュー特徴のセマンティック一貫性とイントラ(インター)クラスのコンパクト性(分散)について検討した。
本稿では,2つの新しい画素対プロトタイプのコントラスト正規化用語を提案する。
我々の手法は、ベースネットワークを変更することなく、既存のWSSSモデルにシームレスに組み込むことができる。
論文 参考訳(メタデータ) (2021-10-14T01:44:57Z) - BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time
Semantic Segmentation [118.46210049742993]
バイラテラル空間ネットワーク(BiSeNet V2)と呼ばれる,速度と精度のトレードオフが良好である効率的なアーキテクチャを提案する。
2,048x1の入力に対して、我々はCityscapesテストセットで72.6%の平均IoUを1つのNVIDIA GeForce 1080 Tiカードで156 FPSで達成した。
論文 参考訳(メタデータ) (2020-04-05T10:26:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。