論文の概要: Detecting Lane and Road Markings at A Distance with Perspective
Transformer Layers
- arxiv url: http://arxiv.org/abs/2003.08550v2
- Date: Sun, 25 Oct 2020 06:38:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 04:26:04.663236
- Title: Detecting Lane and Road Markings at A Distance with Perspective
Transformer Layers
- Title(参考訳): パースペクティブトランスフォーマー層を用いた距離における車線および道路マーキングの検出
- Authors: Zhuoping Yu, Xiaozhou Ren, Yuyao Huang, Wei Tian, Junqiao Zhao
- Abstract要約: 既存の手法では、検出精度は距離の増大とともに劣化することが多い。
これは、遠車線や道路標識が画像中の少数のピクセルを占有しているためである。
逆のパースペクティブマッピングは、パースペクティブの歪みを取り除くために使用できるが、本質的にはアーティファクトに繋がる可能性がある。
- 参考スコア(独自算出の注目度): 5.033948921121557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate detection of lane and road markings is a task of great importance
for intelligent vehicles. In existing approaches, the detection accuracy often
degrades with the increasing distance. This is due to the fact that distant
lane and road markings occupy a small number of pixels in the image, and scales
of lane and road markings are inconsistent at various distances and
perspectives. The Inverse Perspective Mapping (IPM) can be used to eliminate
the perspective distortion, but the inherent interpolation can lead to
artifacts especially around distant lane and road markings and thus has a
negative impact on the accuracy of lane marking detection and segmentation. To
solve this problem, we adopt the Encoder-Decoder architecture in Fully
Convolutional Networks and leverage the idea of Spatial Transformer Networks to
introduce a novel semantic segmentation neural network. This approach
decomposes the IPM process into multiple consecutive differentiable homographic
transform layers, which are called "Perspective Transformer Layers".
Furthermore, the interpolated feature map is refined by subsequent
convolutional layers thus reducing the artifacts and improving the accuracy.
The effectiveness of the proposed method in lane marking detection is validated
on two public datasets: TuSimple and ApolloScape
- Abstract(参考訳): レーンや道路標識の正確な検出は、インテリジェントな車両にとって非常に重要な課題である。
既存の手法では、検出精度はしばしば距離の増加とともに低下する。
これは、遠方の車線と道路のマーキングが画像内の少数のピクセルを占めており、車線と道路のマーキングのスケールが様々な距離と視点で一貫性がないためである。
逆視点マッピング(ipm)は視点歪みの除去に使用できるが、内在的な補間は特に遠方の車線や道路のマーキング周辺のアーティファクトにつながり、レーンマーキング検出とセグメンテーションの精度に悪影響を及ぼす。
この問題を解決するために,完全畳み込みネットワークにおいてエンコーダ・デコーダアーキテクチャを採用し,空間トランスフォーマネットワークのアイデアを活用し,新しい意味セグメンテーションニューラルネットワークを導入する。
このアプローチは、IPMプロセスを複数の連続的な微分可能なホモグラフィック変換層に分解し、これを"Perspective Transformer Layers"と呼ぶ。
さらに、補間特徴マップは、後続の畳み込み層によって洗練され、アーティファクトが減少し、精度が向上する。
レーンマーキング検出における提案手法の有効性を,TuSimpleとApolloScapeの2つの公開データセットで検証した。
関連論文リスト
- Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - Perspective Aware Road Obstacle Detection [104.57322421897769]
道路障害物検出技術は,車間距離が大きくなるにつれて障害物の見かけの規模が減少するという事実を無視することを示す。
画像位置毎に仮想物体の見かけの大きさを符号化したスケールマップを演算することでこれを活用できる。
次に、この視点マップを利用して、遠近法に対応する大きさの道路合成物体に注入することで、トレーニングデータを生成する。
論文 参考訳(メタデータ) (2022-10-04T17:48:42Z) - Pyramid Transformer for Traffic Sign Detection [1.933681537640272]
本稿では,局所性を考慮した新しいピラミッドトランスを提案する。
具体的には、Mraamid Transformerには、複数の空間ピラミッド縮小層があり、入力画像をリッチなマルチスケールコンテキストでトークンに縮小して埋め込む。
実験はドイツ交通信号検出ベンチマーク(GTSDB)で実施された。
論文 参考訳(メタデータ) (2022-07-13T09:21:19Z) - Network Traffic Anomaly Detection Method Based on Multi scale Residual
Feature [4.894147848840537]
ネットワークトラフィックのマルチスケール残差特徴に基づく異常検出手法を提案する。
実験の結果,従来の手法と比較して,提案手法の異常なネットワークトラフィックの検出性能が著しく向上していることがわかった。
論文 参考訳(メタデータ) (2022-05-08T16:18:24Z) - Laneformer: Object-aware Row-Column Transformers for Lane Detection [96.62919884511287]
Laneformerは、自動運転における車線検出に適したトランスフォーマーベースのアーキテクチャである。
様々な視覚タスクにおけるトランスフォーマーエンコーダ・デコーダアーキテクチャの最近の進歩に触発されて、我々は新しいエンドツーエンドのLaneformerアーキテクチャの設計を進める。
論文 参考訳(メタデータ) (2022-03-18T10:14:35Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - LDNet: End-to-End Lane Marking Detection Approach Using a Dynamic Vision
Sensor [0.0]
本稿では,イベントカメラを用いたレーンマーキング検出の新たな応用について検討する。
符号化された特徴の空間分解能は、密度の高密度な空間ピラミッドプールブロックによって保持される。
提案手法の有効性をDVSデータセットを用いて評価した。
論文 参考訳(メタデータ) (2020-09-17T02:15:41Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - LR-CNN: Local-aware Region CNN for Vehicle Detection in Aerial Imagery [43.91170581467171]
最先端の物体検出手法は、大規模な空中画像において、任意の向きの密集した小さなターゲットを検出するのに困難である。
本稿では,航空画像における車両検出のための新しい2段階アプローチとして,地域認識型地域畳み込みニューラルネットワーク(LR-CNN)を提案する。
論文 参考訳(メタデータ) (2020-05-28T19:57:34Z) - End-to-End Lane Marker Detection via Row-wise Classification [13.82948181492772]
自律運転では、信頼性が高く正確な車線マーカーの位置を検出することが重要な課題である。
レーンマーカー検出問題に対する従来のアプローチは、ピクセルレベルの高密度予測タスクを実行し、その後に洗練された後処理を行う。
後処理のステップを使わずに,エンドツーエンドで直接車線マーカー予測を行う手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T12:48:46Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。