論文の概要: TiledSoilingNet: Tile-level Soiling Detection on Automotive
Surround-view Cameras Using Coverage Metric
- arxiv url: http://arxiv.org/abs/2007.00801v1
- Date: Wed, 1 Jul 2020 23:00:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 23:36:55.388275
- Title: TiledSoilingNet: Tile-level Soiling Detection on Automotive
Surround-view Cameras Using Coverage Metric
- Title(参考訳): TiledSoilingNet:Coverage Metricを用いた自動車周囲カメラのタイルレベル土壌検出
- Authors: Arindam Das, Pavel Krizek, Ganesh Sistu, Fabian Burger, Sankaralingam
Madasamy, Michal Uricar, Varun Ravi Kumar, Senthil Yogamani
- Abstract要約: クリーニングシステムを制御するためには,画像中の土壌の局所的検出が必要である。
そこで本研究では, タイル内における各土壌タイプの面積を直接回帰する新しい手法を提案する。
提案手法は,複数の土壌タイプがタイル内で一般的に発生するため,タイル内で支配的なクラスを学習するよりも優れている。
- 参考スコア(独自算出の注目度): 3.341524158186479
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automotive cameras, particularly surround-view cameras, tend to get soiled by
mud, water, snow, etc. For higher levels of autonomous driving, it is necessary
to have a soiling detection algorithm which will trigger an automatic cleaning
system. Localized detection of soiling in an image is necessary to control the
cleaning system. It is also necessary to enable partial functionality in
unsoiled areas while reducing confidence in soiled areas. Although this can be
solved using a semantic segmentation task, we explore a more efficient solution
targeting deployment in low power embedded system. We propose a novel method to
regress the area of each soiling type within a tile directly. We refer to this
as coverage. The proposed approach is better than learning the dominant class
in a tile as multiple soiling types occur within a tile commonly. It also has
the advantage of dealing with coarse polygon annotation, which will cause the
segmentation task. The proposed soiling coverage decoder is an order of
magnitude faster than an equivalent segmentation decoder. We also integrated it
into an object detection and semantic segmentation multi-task model using an
asynchronous back-propagation algorithm. A portion of the dataset used will be
released publicly as part of our WoodScape dataset to encourage further
research.
- Abstract(参考訳): 自動車用カメラ、特にサラウンドビューカメラは、泥や水、雪などで汚れる傾向がある。
高レベルな自動運転には、自動クリーニングシステムを起動する汚れ検出アルゴリズムが必要である。
画像中の汚れの局所的な検出はクリーニングシステムを制御するために必要である。
また, 未土壌地域における部分的な機能を実現するとともに, 土壌の信頼性を低下させる必要がある。
セマンティックセグメンテーションタスクを用いてこれを解くことができるが、低消費電力組み込みシステムにおけるデプロイをターゲットとしたより効率的なソリューションを探索する。
そこで本研究では, タイル内の各土型面積を直接後退させる新しい手法を提案する。
これをカバレッジと呼びます。
提案手法は,複数の土壌タイプがタイル内で一般的に発生するため,タイル内で支配的なクラスを学習するよりも優れている。
また、セグメンテーションタスクを引き起こす粗いポリゴンアノテーションを扱うという利点もある。
提案した土壌被覆デコーダは等価セグメンテーションデコーダよりも桁違いに高速である。
また,非同期バックプロパゲーションアルゴリズムを用いてオブジェクト検出とセマンティックセグメンテーションのマルチタスクモデルに統合した。
使用されるデータセットの一部は、さらなる研究を促進するために、WoodScapeデータセットの一部として公開されます。
関連論文リスト
- DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - Lidar Annotation Is All You Need [0.0]
本稿では,畳み込みニューラルネットワークを用いたマルチセンサ構成による画像分割の効率向上を目的とする。
当社のアプローチにおける重要な革新は、点雲からの粗い接地トラスマスクに対処する、マスク付き損失である。
ベンチマークデータセットに対するアプローチの実験的検証は、高品質の画像セグメンテーションモデルに匹敵する性能を示す。
論文 参考訳(メタデータ) (2023-11-08T15:55:18Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Multi-modal curb detection and filtering [11.74956489227383]
本稿では,カメラセマンティクスと高密度ライダー点雲の融合に基づくロバストなストレッチ検出とフィルタリング手法を提案する。
提案システムは,複雑な都市道路シナリオにおいて,いかなる方向の縁石も検出できることを実証した。
論文 参考訳(メタデータ) (2022-05-14T17:03:41Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - A Novel Upsampling and Context Convolution for Image Semantic
Segmentation [0.966840768820136]
最近のセマンティックセグメンテーションの方法は、しばしば深い畳み込みニューラルネットワークを用いたエンコーダデコーダ構造を採用している。
ネットワーク内の画像の空間情報を効率的に保存するために,ガイドフィルタに基づく高密度アップサンプリング畳み込み法を提案する。
ADE20KとPascal-Contextのベンチマークデータセットでは,それぞれ82.86%,81.62%の画素精度を記録した。
論文 参考訳(メタデータ) (2021-03-20T06:16:42Z) - Image segmentation via Cellular Automata [58.86475603234583]
我々は高解像度画像のセグメンテーションを成功させるセルオートマトンを設計し、訓練する。
私たちの最小のオートマトンは、複雑なセグメンテーションタスクを解決するために1万以下のパラメータを使用します。
論文 参考訳(メタデータ) (2020-08-11T19:04:09Z) - FusionLane: Multi-Sensor Fusion for Lane Marking Semantic Segmentation
Using Deep Neural Networks [1.0062127381149395]
本稿では,LIDARとカメラ融合深層ニューラルネットワークに基づくレーンマーキングセマンティックセマンティックセマンティクス手法を提案する。
14,000以上の画像データセットを用いた実験により,雲鳥の眼球図のセマンティックセグメンテーションにおいて,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-03-09T20:33:30Z) - Key Points Estimation and Point Instance Segmentation Approach for Lane
Detection [65.37887088194022]
本稿では,PINet (Point Instance Network) と呼ばれるトラヒックライン検出手法を提案する。
PINetには、同時にトレーニングされる複数のスタックされた時間ガラスネットワークが含まれている。
PINetはTuSimpleとCulaneのデータセットで競合精度と偽陽性を達成する。
論文 参考訳(メタデータ) (2020-02-16T15:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。