論文の概要: Learning Collision-Free Space Detection from Stereo Images: Homography
Matrix Brings Better Data Augmentation
- arxiv url: http://arxiv.org/abs/2012.07890v3
- Date: Fri, 12 Mar 2021 21:22:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 14:19:06.117253
- Title: Learning Collision-Free Space Detection from Stereo Images: Homography
Matrix Brings Better Data Augmentation
- Title(参考訳): ステレオ画像からの衝突のない空間検出の学習:ホモグラフィマトリクスによるデータの強化
- Authors: Rui Fan, Hengli Wang, Peide Cai, Jin Wu, Mohammud Junaid Bocus, Lei
Qiao and Ming Liu
- Abstract要約: 少数のトレーニングサンプルを使用して、深い畳み込みニューラルネットワーク(DCNN)を訓練することは、依然としてオープンな課題です。
本稿では,dcnnの性能向上に有効なトレーニングデータ拡張手法について検討する。
- 参考スコア(独自算出の注目度): 16.99302954185652
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collision-free space detection is a critical component of autonomous vehicle
perception. The state-of-the-art algorithms are typically based on supervised
learning. The performance of such approaches is always dependent on the quality
and amount of labeled training data. Additionally, it remains an open challenge
to train deep convolutional neural networks (DCNNs) using only a small quantity
of training samples. Therefore, this paper mainly explores an effective
training data augmentation approach that can be employed to improve the overall
DCNN performance, when additional images captured from different views are
available. Due to the fact that the pixels of the collision-free space
(generally regarded as a planar surface) between two images captured from
different views can be associated by a homography matrix, the scenario of the
target image can be transformed into the reference view. This provides a simple
but effective way of generating training data from additional multi-view
images. Extensive experimental results, conducted with six state-of-the-art
semantic segmentation DCNNs on three datasets, demonstrate the effectiveness of
our proposed training data augmentation algorithm for enhancing collision-free
space detection performance. When validated on the KITTI road benchmark, our
approach provides the best results for stereo vision-based collision-free space
detection.
- Abstract(参考訳): 衝突のない空間検出は、自動運転車の知覚の重要な要素である。
最先端のアルゴリズムは一般的に教師付き学習に基づいている。
このような手法の性能は常にラベル付きトレーニングデータの品質と量に依存する。
さらに、少量のトレーニングサンプルだけでディープ畳み込みニューラルネットワーク(DCNN)をトレーニングすることは、依然としてオープンな課題である。
そこで本稿では,異なる視点から得られた追加画像が利用可能である場合,DCNN全体の性能向上に有効なトレーニングデータ拡張手法を主に検討する。
異なる視点から撮影された2つの画像間の衝突のない空間(一般に平面面と見なされる)の画素がホモグラフィ行列によって関連付けられるため、対象画像のシナリオを参照ビューに変換することができる。
これは、追加のマルチビュー画像からトレーニングデータを生成する、シンプルだが効果的な方法を提供する。
3つのデータセット上で6つの最先端セマンティクスセグメンテーションdcnnを用いた大規模実験を行い,衝突のない空間検出性能向上のためのトレーニングデータ拡張アルゴリズムの有効性を実証した。
kitti roadベンチマークで検証すると、ステレオビジョンに基づく衝突のない空間検出に最適な結果が得られる。
関連論文リスト
- Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Attention Mechanism for Contrastive Learning in GAN-based Image-to-Image
Translation [3.90801108629495]
本稿では,異なる領域にまたがって高品質な画像を生成可能なGANモデルを提案する。
実世界から取得した画像データと3Dゲームからのシミュレーション画像を用いて、Contrastive Learningを利用してモデルを自己指導的に訓練する。
論文 参考訳(メタデータ) (2023-02-23T14:23:23Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。