論文の概要: Unmasking Anomalies in Road-Scene Segmentation
- arxiv url: http://arxiv.org/abs/2307.13316v1
- Date: Tue, 25 Jul 2023 08:23:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 17:54:42.530542
- Title: Unmasking Anomalies in Road-Scene Segmentation
- Title(参考訳): 道路シーンセグメンテーションにおけるアンマスキング異常
- Authors: Shyam Nandan Rai, Fabio Cermelli, Dario Fontanel, Carlo Masone,
Barbara Caputo
- Abstract要約: 異常セグメンテーションはアプリケーションを駆動するための重要なタスクである。
本稿では,画素単位の分類からマスク分類へのシフトによるパラダイム変化を提案する。
Mask2Anomalyはマスク分類アーキテクチャに異常検出手法を統合する可能性を示した。
- 参考スコア(独自算出の注目度): 18.253109627901566
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly segmentation is a critical task for driving applications, and it is
approached traditionally as a per-pixel classification problem. However,
reasoning individually about each pixel without considering their contextual
semantics results in high uncertainty around the objects' boundaries and
numerous false positives. We propose a paradigm change by shifting from a
per-pixel classification to a mask classification. Our mask-based method,
Mask2Anomaly, demonstrates the feasibility of integrating an anomaly detection
method in a mask-classification architecture. Mask2Anomaly includes several
technical novelties that are designed to improve the detection of anomalies in
masks: i) a global masked attention module to focus individually on the
foreground and background regions; ii) a mask contrastive learning that
maximizes the margin between an anomaly and known classes; and iii) a mask
refinement solution to reduce false positives. Mask2Anomaly achieves new
state-of-the-art results across a range of benchmarks, both in the per-pixel
and component-level evaluations. In particular, Mask2Anomaly reduces the
average false positives rate by 60% wrt the previous state-of-the-art. Github
page:
https://github.com/shyam671/Mask2Anomaly-Unmasking-Anomalies-in-Road-Scene-Segmentation.
- Abstract(参考訳): 異常セグメンテーションはアプリケーションを駆動する上で重要なタスクであり、伝統的にピクセル単位の分類問題としてアプローチされる。
しかし、文脈意味論を考慮せずに各ピクセルを個別に推論すると、オブジェクトの境界や多数の偽陽性に高い不確実性をもたらす。
本稿では,画素単位の分類からマスク分類へのシフトによるパラダイム変化を提案する。
マスクベース手法であるmask2anomalyは,マスク分類アーキテクチャにおいて異常検出手法を統合する可能性を示す。
Mask2Anomalyには、マスクの異常の検出を改善するために設計されたいくつかの技術ノベルティが含まれている。
一 前景及び背景地域に個別に焦点をあてるグローバルマスク付注意モジュール
二 異常と既知のクラスの間のマージンを最大化するマスクコントラスト学習
三 偽陽性を減少させるマスク改良液。
Mask2Anomalyは、ピクセルごとの評価とコンポーネントレベルの評価の両方において、様々なベンチマークで最新の結果を達成する。
特に、Mask2Anomalyは、平均偽陽性率を前回の最先端よりも60%削減する。
Githubのページ: https://github.com/shyam671/Mask2Anomaly-Unmasking-Anomalies-in-Road-Scene-Segmentation。
関連論文リスト
- ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - Variance-insensitive and Target-preserving Mask Refinement for
Interactive Image Segmentation [68.16510297109872]
ポイントベースのインタラクティブなイメージセグメンテーションは、セマンティックセグメンテーションや画像編集といったアプリケーションにおけるマスクアノテーションの負担を軽減することができる。
本稿では,ユーザ入力の少ないセグメンテーション品質を向上する新しい手法である可変無感・ターゲット保存マスクリファインメントを提案する。
GrabCut、バークレー、SBD、DAVISデータセットの実験は、インタラクティブな画像セグメンテーションにおける我々の手法の最先端性能を実証している。
論文 参考訳(メタデータ) (2023-12-22T02:31:31Z) - Mask2Anomaly: Mask Transformer for Universal Open-set Segmentation [29.43462426812185]
本稿では,画素単位の分類からマスク分類へのシフトによるパラダイム変化を提案する。
マスクをベースとしたMask2Anomalyは,マスク分類アーキテクチャの統合の可能性を示した。
総合的質的・質的評価により, Mask2Anomaly は新たな最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2023-09-08T20:07:18Z) - DFormer: Diffusion-guided Transformer for Universal Image Segmentation [86.73405604947459]
提案したDFormerは,拡散モデルを用いて画像分割タスクをデノナイズプロセスとみなしている。
我々のDFormerは、ランダムに生成されたマスクの集合から、マスクとそれに対応するカテゴリを直接予測します。
我々のDFormerは、最近の拡散型汎光学分割法Pix2Seq-Dより優れており、MS COCO val 2017セットで3.6%向上している。
論文 参考訳(メタデータ) (2023-06-06T06:33:32Z) - Mask Transfiner for High-Quality Instance Segmentation [95.74244714914052]
高品質で効率的なインスタンスセグメンテーションのためのMask Transfinerを提案する。
当社のアプローチでは, エラーが発生しやすい木ノードを検出し, エラーを並列に自己修正する。
私たちのコードとトレーニングされたモデルは、http://vis.xyz/pub/transfiner.comで公開されます。
論文 参考訳(メタデータ) (2021-11-26T18:58:22Z) - Pseudo-mask Matters inWeakly-supervised Semantic Segmentation [24.73662587701187]
例えば,クラスアクティベーションマップ(CAM)からの高品質な擬似マスク生成や,ノイズの多い擬似マスク監視によるトレーニングなどである。
i)変分平滑化の係数を適応的にCAMを平滑化させる、(ii)各クラスの重要性を示す新しい指標に基づいて拡張されたCAMを擬似マスクに投影する、(iii)擬似雑音の影響を抑えるための事前的アンダーフィッティング戦略
論文 参考訳(メタデータ) (2021-08-30T05:35:28Z) - Per-Pixel Classification is Not All You Need for Semantic Segmentation [184.2905747595058]
マスク分類はセマンティックレベルのセグメンテーションタスクとインスタンスレベルのセグメンテーションタスクの両方を解くのに十分一般的である。
マスクの集合を予測する単純なマスク分類モデルであるMaskFormerを提案する。
提案手法は,現在の最先端セマンティック(ADE20Kでは55.6 mIoU)とパノプティックセグメンテーション(COCOでは52.7 PQ)モデルの両方に優れる。
論文 参考訳(メタデータ) (2021-07-13T17:59:50Z) - Image Inpainting by End-to-End Cascaded Refinement with Mask Awareness [66.55719330810547]
任意の欠落領域を塗りつぶすことは、様々なマスクされた領域で有効な特徴を学ぶことは非自明だから難しい。
符号化フェーズにおける欠落領域のマルチスケール特徴を学習する新しいマスク対応インペイントソリューションを提案する。
私たちのフレームワークは、3つの公開データセットに関する広範な実験を通じて定量的および定性的に検証されます。
論文 参考訳(メタデータ) (2021-04-28T13:17:47Z) - Investigating and Simplifying Masking-based Saliency Methods for Model
Interpretability [5.387323728379395]
画像の最も情報性の高い領域を識別する残差マップは、モデル解釈可能性に有用である。
唾液マップを作成するための一般的なアプローチは、画像の一部をマスクする入力マスクを生成することである。
マスキングモデルでは,クラス毎に10個のサンプルをトレーニングすることが可能であり,ローカライズエラーが0.7ポイントしか増加せず,いまだにサリエンシマップを生成可能であることを示す。
論文 参考訳(メタデータ) (2020-10-19T18:00:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。