論文の概要: Approximate Size Targets Are Sufficient for Accurate Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2503.06954v1
- Date: Mon, 10 Mar 2025 06:02:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:48:15.002272
- Title: Approximate Size Targets Are Sufficient for Accurate Semantic Segmentation
- Title(参考訳): 高精度セマンティックセグメンテーションのための近似サイズターゲット
- Authors: Xingye Fan, Zhongwen, Zhang, Yuri Boykov,
- Abstract要約: 相対的なオブジェクトサイズ分布に近似するバイナリクラスタグを拡張することで、オフザシェルフアーキテクチャはセグメンテーション問題を解決することができる。
平均予測に対するゼロ回避KL偏差損失は、標準画素精度の監督に匹敵するセグメンテーション精度を生成する。
我々のアイデアはPASCAL VOC上で、近似オブジェクトサイズの人間のアノテーションを用いて検証されている。
- 参考スコア(独自算出の注目度): 52.239136918460616
- License:
- Abstract: This paper demonstrates a surprising result for segmentation with image-level targets: extending binary class tags to approximate relative object-size distributions allows off-the-shelf architectures to solve the segmentation problem. A straightforward zero-avoiding KL-divergence loss for average predictions produces segmentation accuracy comparable to the standard pixel-precise supervision with full ground truth masks. In contrast, current results based on class tags typically require complex non-reproducible architectural modifications and specialized multi-stage training procedures. Our ideas are validated on PASCAL VOC using our new human annotations of approximate object sizes. We also show the results on COCO and medical data using synthetically corrupted size targets. All standard networks demonstrate robustness to the size targets' errors. For some classes, the validation accuracy is significantly better than the pixel-level supervision; the latter is not robust to errors in the masks. Our work provides new ideas and insights on image-level supervision in segmentation and may encourage other simple general solutions to the problem.
- Abstract(参考訳): 本稿では,画像レベルの目標に対するセグメンテーションの驚くべき結果を示す。バイナリクラスタグを相対的なオブジェクトサイズ分布に拡張することで,セグメンテーションの問題を解決することができる。
平均的な予測に対するゼロ回避KL偏差損失は、全基底真理マスクによる標準的な画素精度の監督に匹敵するセグメンテーション精度を生成する。
対照的に、クラスタグに基づく現在の結果は、通常、複雑な再現不可能なアーキテクチャ修正と、特殊な多段階トレーニング手順を必要とする。
我々のアイデアはPASCAL VOC上で、近似オブジェクトサイズの人間のアノテーションを用いて検証されている。
また,COCOおよび医療データに対して,合成劣化したサイズターゲットを用いた結果を示す。
すべての標準ネットワークは、サイズターゲットのエラーに対して堅牢性を示す。
一部のクラスでは、検証精度はピクセルレベルの監視よりも著しく優れており、後者はマスクのエラーに対して堅牢ではない。
我々の研究は、セグメンテーションにおける画像レベルの監督に関する新しいアイデアと洞察を提供し、この問題に対する他の単純な一般的な解決策を奨励するかもしれない。
関連論文リスト
- Revisiting Evaluation Metrics for Semantic Segmentation: Optimization
and Evaluation of Fine-grained Intersection over Union [113.20223082664681]
そこで本研究では,mIoUsの微細化と,それに対応する最悪の指標を提案する。
これらのきめ細かいメトリクスは、大きなオブジェクトに対するバイアスの低減、よりリッチな統計情報、モデルとデータセット監査に関する貴重な洞察を提供する。
ベンチマークでは,1つの測定値に基づかないことの必要性を強調し,微細なmIoUsが大きな物体への偏りを減少させることを確認した。
論文 参考訳(メタデータ) (2023-10-30T03:45:15Z) - Long-tail Detection with Effective Class-Margins [4.18804572788063]
本稿では, 未知のテストセットの平均精度評価基準が, マージンベースの二項分類誤差によってどのように制限されているかを示す。
テキスト・エフェクティブ・クラス・マージン・ロス(ECM)と呼ばれる新しいサロゲート目標を用いて、マージンベースの二項分類誤差を最適化する。
論文 参考訳(メタデータ) (2023-01-23T21:25:24Z) - CAR: Class-aware Regularizations for Semantic Segmentation [20.947897583427192]
特徴学習におけるクラス内分散とクラス間距離を最適化するためのクラス認識正規化(CAR)手法を提案する。
本手法は,OCRやCPNetを含む既存のセグメンテーションモデルに容易に適用することができる。
論文 参考訳(メタデータ) (2022-03-14T15:02:48Z) - Segmenter: Transformer for Semantic Segmentation [79.9887988699159]
セマンティックセグメンテーションのためのトランスフォーマーモデルであるSegmenterを紹介します。
最近のViT(Vision Transformer)上に構築し,セマンティックセグメンテーションに拡張する。
これは、挑戦的なADE20Kデータセット上でのアートの状態を上回り、Pascal ContextとCityscapesでオンパーを実行する。
論文 参考訳(メタデータ) (2021-05-12T13:01:44Z) - Exposing Semantic Segmentation Failures via Maximum Discrepancy
Competition [102.75463782627791]
オープンビジュアルの世界において,既存の意味セグメンテーション手法の失敗を露呈することで,質問に答える。
モデル改ざんに関するこれまでの研究に触発され、任意に大きい画像セットから始まり、2つのセグメンテーション方法間の差分法(MAD)をMAximizingすることによって、小さな画像セットを自動的にサンプリングします。
選択された画像は、2つの方法のいずれか(または両方)を偽造する最大の可能性を持っている。
また,MADコンペティションにおいて,障害の露呈が困難であるセグメンテーション法について検討した。
論文 参考訳(メタデータ) (2021-02-27T16:06:25Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - A Weakly-Supervised Semantic Segmentation Approach based on the Centroid
Loss: Application to Quality Control and Inspection [6.101839518775968]
本稿では,新しい損失関数を用いた弱教師付きセマンティックセマンティックセマンティクス手法の提案と評価を行う。
アプローチのパフォーマンスは,2つの業界関連ケーススタディのデータセットに対して評価される。
論文 参考訳(メタデータ) (2020-10-26T09:08:21Z) - AinnoSeg: Panoramic Segmentation with High Perfomance [4.867465475957119]
現在のパノラマセグメンテーションアルゴリズムは文脈意味論に関係しているが、画像の詳細は十分に処理されていない。
これらの課題に対処するために,本稿ではいくつかの有用なトリックを提案する。
AinnoSegと名付けられたこれらの操作はすべて、よく知られたデータセットADE20Kで最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2020-07-21T04:16:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。