論文の概要: A Performance Increment Strategy for Semantic Segmentation of Low-Resolution Images from Damaged Roads
- arxiv url: http://arxiv.org/abs/2411.16295v1
- Date: Mon, 25 Nov 2024 11:27:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:20:23.683467
- Title: A Performance Increment Strategy for Semantic Segmentation of Low-Resolution Images from Damaged Roads
- Title(参考訳): 被害道路からの低解像度画像のセマンティックセグメンテーションのための性能向上戦略
- Authors: Rafael S. Toledo, Cristiano S. Oliveira, Vitor H. T. Oliveira, Eric A. Antonelo, Aldo von Wangenheim,
- Abstract要約: 新興国の代表的データセットは、貧弱な道路の低解像度画像で構成されている。
このシナリオでは、3つの課題が生じる: ピクセルが少ないオブジェクト、未定義の形状を持つオブジェクト、非常に不足したクラス。
これらの課題に対処するため、この研究は、パフォーマンスを高めるための14のトレーニング実験の方法論として、セマンティックのパフォーマンスインクリメント戦略(PISSS)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Autonomous driving needs good roads, but 85% of Brazilian roads have damages that deep learning models may not regard as most semantic segmentation datasets for autonomous driving are high-resolution images of well-maintained urban roads. A representative dataset for emerging countries consists of low-resolution images of poorly maintained roads and includes labels of damage classes; in this scenario, three challenges arise: objects with few pixels, objects with undefined shapes, and highly underrepresented classes. To tackle these challenges, this work proposes the Performance Increment Strategy for Semantic Segmentation (PISSS) as a methodology of 14 training experiments to boost performance. With PISSS, we reached state-of-the-art results of 79.8 and 68.8 mIoU on the Road Traversing Knowledge (RTK) and Technik Autonomer Systeme 500 (TAS500) test sets, respectively. Furthermore, we also offer an analysis of DeepLabV3+ pitfalls for small object segmentation.
- Abstract(参考訳): 自動運転には良い道路が必要だが、ブラジルの道路の85%は、ディープラーニングモデルでは、自律運転のセマンティックセグメンテーションデータセットが、よく整備された都市道路の高解像度画像であるため、考慮できない損傷がある。
新興国の代表的データセットは、貧弱な道路の低解像度画像で構成され、損傷クラスのラベルを含む。このシナリオでは、少ないピクセルのオブジェクト、未定義の形状のオブジェクト、高度に表現されていないクラスという3つの課題が発生する。
これらの課題に対処するため、この研究は、パフォーマンスを高めるための14のトレーニング実験の方法論として、セマンティックセグメンテーションのためのパフォーマンスインクリメント戦略(PISSS)を提案する。
PISSSでは、ロードトラバース・ナレッジ(RTK)とテクニク・オートノマー・システム500(TAS500)のテストセットで、それぞれ79.8mIoUと68.8mIoUの最先端結果に達した。
さらに、小さなオブジェクトセグメンテーションのためのDeepLabV3+の落とし穴の分析も提供する。
関連論文リスト
- RSRD: A Road Surface Reconstruction Dataset and Benchmark for Safe and
Comfortable Autonomous Driving [67.09546127265034]
道路表面の再構築は、車両の走行計画と制御システムの解析と予測を促進するのに役立つ。
我々は,様々な運転条件下で,特定のプラットフォームで収集した実世界,高解像度,高精度のデータセットであるRoad Surface Reconstructionデータセットを紹介した。
約16,000対のステレオ画像、原点雲、地中深度・不均等地図を含む一般的な道路形態を網羅している。
論文 参考訳(メタデータ) (2023-10-03T17:59:32Z) - R2S100K: Road-Region Segmentation Dataset For Semi-Supervised Autonomous
Driving in the Wild [11.149480965148015]
ロードリージョンデータセット(ロードリージョンデータセット、R2S100K)は、道路セグメンテーションのトレーニングと評価のための大規模データセットおよびベンチマークである。
R2S100Kは、1000KM以上の道路を網羅する大規模で多様なビデオシーケンスから抽出された100K画像からなる。
ラベルのないデータを活用することで学習を改善するための,EDSに基づく効率的なデータサンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-08-11T21:31:37Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - Pavementscapes: a large-scale hierarchical image dataset for asphalt
pavement damage segmentation [9.160763314165367]
本研究では,舗装損傷セグメンテーション手法の開発と評価を行う大規模データセットPavementscapesを提案する。
合計8,680件の損傷事例には、ピクセルレベルで6つの損傷クラスが手動でラベル付けされている。
数値実験では、舗装損傷をセグメント化できる高い性能のディープニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T03:40:27Z) - CV 3315 Is All You Need : Semantic Segmentation Competition [14.818852884385015]
このコンペティションは、車載カメラのビューに基づいてUrban-Senseに焦点を当てている。
クラスの非バランスなUrban-Senseイメージデータセットは、既存のソリューションに挑戦する。
ディープコンベンショナルニューラルネットワークに基づくセマンティックセグメンテーション手法は、現実のアプリケーションに適用可能な柔軟なソリューションとなる。
論文 参考訳(メタデータ) (2022-06-25T06:27:57Z) - SegmentMeIfYouCan: A Benchmark for Anomaly Segmentation [111.61261419566908]
ディープニューラルネットワーク(DNN)は通常、閉集合のセマンティッククラスで訓練される。
未発見のオブジェクトを扱うには不備だ。
このような物体の検出と局在化は、自動運転の認識などの安全クリティカルなアプリケーションに不可欠です。
論文 参考訳(メタデータ) (2021-04-30T07:58:19Z) - OFFSEG: A Semantic Segmentation Framework For Off-Road Driving [6.845371503461449]
OFFSEGと呼ばれるオフロードセマンティックセグメンテーションのためのフレームワークを提案する。
オフロードセマンティクスセグメンテーションは、不均一な地形、非構造なクラス境界、不規則な特徴、強いテクスチャが存在するため、困難である。
論文 参考訳(メタデータ) (2021-03-23T09:45:41Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in
Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。
本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文 参考訳(メタデータ) (2020-09-22T08:25:44Z) - 3D-DEEP: 3-Dimensional Deep-learning based on elevation patterns forroad
scene interpretation [0.0]
CNNに基づくセマンティックセグメンテーションのための新しいネットアーキテクチャ(3D-DEEP)とそのエンドツーエンドトレーニング手法について述べる。
開発されたモデルは、Cityscapesデータセット上でトレーニングされ、検証された。
一方、KITTIdatasetでは、F1エラー値は97.85%、96.02%に達している。
論文 参考訳(メタデータ) (2020-09-01T10:18:08Z) - VehicleNet: Learning Robust Visual Representation for Vehicle
Re-identification [116.1587709521173]
我々は,4つのパブリックな車両データセットを活用することで,大規模車両データセット(VabyNet)を構築することを提案する。
VehicleNetからより堅牢な視覚表現を学習するための、シンプルで効果的な2段階プログレッシブアプローチを設計する。
AICity Challengeのプライベートテストセットにおいて,最先端の精度86.07%mAPを実現した。
論文 参考訳(メタデータ) (2020-04-14T05:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。