論文の概要: Small Objects Matters in Weakly-supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2309.14117v1
- Date: Mon, 25 Sep 2023 13:15:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 15:28:01.003962
- Title: Small Objects Matters in Weakly-supervised Semantic Segmentation
- Title(参考訳): 弱制御セマンティックセグメンテーションにおける微小物体
- Authors: Cheolhyun Mun, Sanghuk Lee, Youngjung Uh, Junsuk Choe, Hyeran Byun
- Abstract要約: 弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は、画像レベルのラベルのみを訓練用として画素単位で分類する。
そこで本研究では,異なるオブジェクトサイズにまたがる包括的評価を行うための新しい評価基準を提案する。
- 参考スコア(独自算出の注目度): 27.389313104946787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly-supervised semantic segmentation (WSSS) performs pixel-wise
classification given only image-level labels for training. Despite the
difficulty of this task, the research community has achieved promising results
over the last five years. Still, current WSSS literature misses the detailed
sense of how well the methods perform on different sizes of objects. Thus we
propose a novel evaluation metric to provide a comprehensive assessment across
different object sizes and collect a size-balanced evaluation set to complement
PASCAL VOC. With these two gadgets, we reveal that the existing WSSS methods
struggle in capturing small objects. Furthermore, we propose a size-balanced
cross-entropy loss coupled with a proper training strategy. It generally
improves existing WSSS methods as validated upon ten baselines on three
different datasets.
- Abstract(参考訳): 弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は、画像レベルのラベルのみを訓練用として画素単位で分類する。
この課題の難しさにもかかわらず、研究コミュニティは過去5年間に有望な成果を上げてきた。
しかし、現在のWSSSの文献は、メソッドがオブジェクトの異なるサイズでどのように機能するかという詳細な感覚を見逃している。
そこで本研究では,異なる対象サイズを包括的に評価し,pascal vocを補完するサイズバランス評価集合を収集するための新しい評価指標を提案する。
これら2つのガジェットで、既存のWSSSメソッドが小さなオブジェクトをキャプチャするのに苦労していることを明らかにする。
さらに,適切なトレーニング戦略を組み込んだサイズバランスのクロスエントロピー損失を提案する。
一般的に、既存のWSSSメソッドを改善し、3つの異なるデータセットで10のベースラインで検証する。
関連論文リスト
- Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection [133.66006666465447]
現在のメトリクスはサイズに敏感で、大きなオブジェクトが集中し、小さなオブジェクトが無視される傾向があります。
サイズに基づくバイアスは、追加のセマンティック情報なしでは不適切であるため、評価はサイズ不変であるべきだと論じる。
我々は,この目標に適した最適化フレームワークを開発し,異なる大きさのオブジェクトの検出において,大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-05-16T03:01:06Z) - For A More Comprehensive Evaluation of 6DoF Object Pose Tracking [22.696375341994035]
上記の問題に対処するために、統一されたベンチマークに貢献する。
YCBVのより正確なアノテーションとして,多視点多目的グローバルポーズ改善法を提案する。
実験では,リアルな半合成データセットを用いて,提案手法の精度と信頼性を検証した。
論文 参考訳(メタデータ) (2023-09-14T15:35:08Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Spatial Reasoning for Few-Shot Object Detection [21.3564383157159]
本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
論文 参考訳(メタデータ) (2022-11-02T12:38:08Z) - Recent Few-Shot Object Detection Algorithms: A Survey with Performance
Comparison [54.357707168883024]
Few-Shot Object Detection (FSOD)は、人間の学習能力を模倣する。
FSODは、学習した汎用オブジェクトの知識を共通のヘビーテールから新しいロングテールオブジェクトクラスにインテリジェントに転送する。
本稿では,問題定義,共通データセット,評価プロトコルなどを含むFSODの概要を紹介する。
論文 参考訳(メタデータ) (2022-03-27T04:11:28Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。