論文の概要: Benchmarking the Robustness of Panoptic Segmentation for Automated
Driving
- arxiv url: http://arxiv.org/abs/2402.15469v1
- Date: Fri, 23 Feb 2024 18:00:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 13:54:01.946996
- Title: Benchmarking the Robustness of Panoptic Segmentation for Automated
Driving
- Title(参考訳): 自動走行におけるパノプティックセグメンテーションのロバスト性評価
- Authors: Yiting Wang, Haonan Zhao, Daniel Gummadi, Mehrdad Dianati, Kurt
Debattista and Valentina Donzella
- Abstract要約: この研究は、AADのための単眼セグメンテーションモデルのロバスト性を評価するための統一パイプラインを提案する。
提案されたパイプラインの最初のステップは、現実のノイズ要因を反映した劣化したカメラデータを生成することである。
次に、セグメンテーション性能の変動を、選択した8つの画像品質指標に相関させる。
- 参考スコア(独自算出の注目度): 11.083177196976603
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Precise situational awareness is required for the safe decision-making of
assisted and automated driving (AAD) functions. Panoptic segmentation is a
promising perception technique to identify and categorise objects, impending
hazards, and driveable space at a pixel level. While segmentation quality is
generally associated with the quality of the camera data, a comprehensive
understanding and modelling of this relationship are paramount for AAD system
designers. Motivated by such a need, this work proposes a unifying pipeline to
assess the robustness of panoptic segmentation models for AAD, correlating it
with traditional image quality. The first step of the proposed pipeline
involves generating degraded camera data that reflects real-world noise
factors. To this end, 19 noise factors have been identified and implemented
with 3 severity levels. Of these factors, this work proposes novel models for
unfavourable light and snow. After applying the degradation models, three
state-of-the-art CNN- and vision transformers (ViT)-based panoptic segmentation
networks are used to analyse their robustness. The variations of the
segmentation performance are then correlated to 8 selected image quality
metrics. This research reveals that: 1) certain specific noise factors produce
the highest impact on panoptic segmentation, i.e. droplets on lens and Gaussian
noise; 2) the ViT-based panoptic segmentation backbones show better robustness
to the considered noise factors; 3) some image quality metrics (i.e. LPIPS and
CW-SSIM) correlate strongly with panoptic segmentation performance and
therefore they can be used as predictive metrics for network performance.
- Abstract(参考訳): AAD(Assisted and automated driving)機能の安全な意思決定には,正確な状況認識が必要である。
パンオプティカルセグメンテーション(panoptic segmentation)は、物体を識別し分類し、危険を回避し、ピクセルレベルで駆動可能な空間を作る、有望な知覚技術である。
セグメンテーションの品質は一般的にカメラデータの品質と関係するが、この関係の包括的理解とモデリングはaadシステム設計者にとって重要である。
このようなニーズに応えて、この研究は、従来の画像品質と相関して、AADのための単視分割モデルの堅牢性を評価する統一パイプラインを提案する。
提案パイプラインの最初のステップは、実世界のノイズ要因を反映した劣化したカメラデータを生成することである。
この結果、19のノイズ要因が特定され、3つの重大度レベルで実装されている。
これらの要因のうち,本研究は,好ましくない光と雪の新しいモデルを提案する。
劣化モデルを適用した後、3つの最先端cnnおよびビジョントランスフォーマ(vit)ベースのパンオプティックセグメンテーションネットワークを用いてロバスト性を分析する。
次に、セグメンテーション性能のバリエーションを、選択した8つの画像品質指標に関連付ける。
この研究は
1) 特定のノイズ要因は, パンオプティカルセグメンテーション, すなわちレンズやガウスノイズに対する液滴に最も影響を及ぼす。
2)vitに基づくパンオプティカルセグメンテーションバックボーンは,検討された雑音要因に対するロバスト性が向上する。
3)いくつかの画像品質指標(LPIPSとCW-SSIM)は、光学的セグメンテーション性能と強く相関しているため、ネットワーク性能の予測指標として使用できる。
関連論文リスト
- Sensitivity-Informed Augmentation for Robust Segmentation [21.609070498399863]
カメラ品質の変動やレンズ歪みなどの内部ノイズはセグメンテーションモデルの性能に影響を与える可能性がある。
我々は,学習ベースセグメンテーションモデルの堅牢性を高めるために,効率的で適応性があり,勾配のない手法を提案する。
論文 参考訳(メタデータ) (2024-06-03T15:25:45Z) - Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System [7.1083241462091165]
我々は,光学的文字認識(OCR)を基本とする外部モダリティ誘導データマイニングフレームワークを導入し,画像から統計的特徴を抽出する。
提案手法の重要な側面は、単一のモーダル認識モデルを用いて抽出された外部モーダル特徴のアライメントであり、畳み込みニューラルネットワークによって符号化された画像特徴である。
本手法は欠陥検出モデルのリコール率を大幅に向上させ,挑戦シナリオにおいても高い堅牢性を維持する。
論文 参考訳(メタデータ) (2024-03-18T07:41:39Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - FS-BAND: A Frequency-Sensitive Banding Detector [55.59101150019851]
バンディング・アーティファクト(Banding artifact)は、階段のような輪郭(contour)として知られ、圧縮や伝達などで発生する一般的な品質の不快さである。
周波数感度バンディング検出器 (FS-BAND) と呼ばれる,帯状アーティファクトを捕捉・評価するための非参照帯状検出モデルを提案する。
実験結果から,FS-BAND法は画像品質評価(IQA)手法よりもバンドリング分類タスクの精度が高い結果を得た。
論文 参考訳(メタデータ) (2023-11-30T03:20:42Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - TMS-Net: A Segmentation Network Coupled With A Run-time Quality Control
Method For Robust Cardiac Image Segmentation [0.0]
ディープネットワークは、心臓磁気共鳴イメージング(MRI)画像のセグメンテーションに顕著な性能を示した。
ディープネットワークは、医師の信頼性を低下させるロバスト性の問題のために、医療クリニックで広く使われるようになるのが遅い。
本稿では,コサイン類似度によって測定されたマルチビューネットワークTMS-Netのデコーダ間の合意に基づく品質管理手法を提案する。
論文 参考訳(メタデータ) (2022-12-21T09:40:23Z) - DisCoVQA: Temporal Distortion-Content Transformers for Video Quality
Assessment [56.42140467085586]
いくつかの時間的変動は時間的歪みを引き起こし、余分な品質劣化を引き起こす。
人間の視覚システムは、しばしば異なる内容のフレームに対して異なる注意を向ける。
本稿では, この2つの問題に対処するための, トランスフォーマーを用いたVQA手法を提案する。
論文 参考訳(メタデータ) (2022-06-20T15:31:27Z) - Treatment Learning Causal Transformer for Noisy Image Classification [62.639851972495094]
本研究では,この2値情報「ノイズの存在」を画像分類タスクに組み込んで予測精度を向上させる。
因果的変動推定から動機付け,雑音画像分類のための頑健な特徴表現を潜在生成モデルを用いて推定するトランスフォーマーに基づくアーキテクチャを提案する。
また、パフォーマンスベンチマークのための幅広いノイズ要素を取り入れた、新しいノイズの多い画像データセットも作成する。
論文 参考訳(メタデータ) (2022-03-29T13:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。