論文の概要: Lane2Seq: Towards Unified Lane Detection via Sequence Generation
- arxiv url: http://arxiv.org/abs/2402.17172v1
- Date: Tue, 27 Feb 2024 03:13:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 17:50:24.550171
- Title: Lane2Seq: Towards Unified Lane Detection via Sequence Generation
- Title(参考訳): Lane2Seq:シーケンス生成による統一レーン検出を目指して
- Authors: Kunyang Zhou
- Abstract要約: Lane2Seqは、レーン検出のための新しいシーケンス生成ベースのフレームワークである。
シーケンス生成タスクとしてレーン検出をキャストすることで、様々なレーン検出フォーマットを統一する。
Lane2Seqはベンチマークで競合性能を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a novel sequence generation-based framework for
lane detection, called Lane2Seq. It unifies various lane detection formats by
casting lane detection as a sequence generation task. This is different from
previous lane detection methods, which depend on well-designed task-specific
head networks and corresponding loss functions. Lane2Seq only adopts a plain
transformer-based encoder-decoder architecture with a simple cross-entropy
loss. Additionally, we propose a new multi-format model tuning based on
reinforcement learning to incorporate the task-specific knowledge into
Lane2Seq. Experimental results demonstrate that such a simple sequence
generation paradigm not only unifies lane detection but also achieves
competitive performance on benchmarks. For example, Lane2Seq gets 97.95\% and
97.42\% F1 score on Tusimple and LLAMAS datasets, establishing a new
state-of-the-art result for two benchmarks.
- Abstract(参考訳): 本稿では,レーン検出のための新しいシーケンス生成に基づくフレームワーク lane2seq を提案する。
シーケンス生成タスクとしてレーン検出をキャストすることで、様々なレーン検出フォーマットを統一する。
これは、よく設計されたタスク固有のヘッドネットワークと対応する損失関数に依存する以前のレーン検出方法とは異なる。
Lane2Seqは、単純なクロスエントロピー損失を持つプレーントランスフォーマーベースのエンコーダデコーダアーキテクチャのみを採用する。
さらに,タスク固有の知識をLane2Seqに組み込むため,強化学習に基づく新しいマルチフォーマットモデルチューニングを提案する。
実験の結果、このような単純なシーケンス生成パラダイムはレーン検出を統一するだけでなく、ベンチマークでの競合性能も達成できることが示されている。
例えば、Lane2SeqはTusimpleとLLAMASのデータセットで97.95\%と97.42\%のF1スコアを取得し、2つのベンチマークで新たな最先端結果を確立する。
関連論文リスト
- Cross Dataset Analysis and Network Architecture Repair for Autonomous
Car Lane Detection [5.428120316375907]
自動運転車の車線検出アプリケーションにおいて,クロスデータセット解析とネットワークアーキテクチャの修復を行った。
ERFCondLaneNetは、複雑なトポロジを持つ車線検出の難しさを解決するために車線識別フレームワークとして使用されるCondlaneNetの拡張である。
論文 参考訳(メタデータ) (2024-09-10T20:27:49Z) - HoughLaneNet: Lane Detection with Deep Hough Transform and Dynamic
Convolution [8.97991745734826]
レーンは狭く、断片化され、しばしば交通量が多いために、検出の困難を生じさせる。
画像中のすべての車線特徴をHoughパラメータ空間に組み合わせた階層的Deep Hough Transform (DHT) 手法を提案する。
提案するネットワーク構造は,重閉塞あるいは摩耗された車線画像の検出性能の向上を実証する。
論文 参考訳(メタデータ) (2023-07-07T10:08:29Z) - End-to-End Lane detection with One-to-Several Transformer [6.79236957488334]
O2SFormerはResNet18バックボーンのDETRよりも12.5倍高速に収束する。
ResNet50のバックボーンを持つO2SFormerは、CULaneデータセット上で77.83%のF1スコアを獲得し、既存のTransformerベースおよびCNNベースの検出器を上回っている。
論文 参考訳(メタデータ) (2023-05-01T06:07:11Z) - Unified Sequence-to-Sequence Learning for Single- and Multi-Modal Visual Object Tracking [64.28025685503376]
SeqTrackは、ビジュアルトラッキングをシーケンス生成タスクとしてキャストし、オブジェクト境界ボックスを自動回帰的に予測する。
SeqTrackv2は補助モダリティのための統一インターフェースとタスクを指定するためのタスクプロンプトトークンのセットを統合している。
このシーケンス学習パラダイムは、トラッキングフレームワークを単純化するだけでなく、14の挑戦的なベンチマークで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-04-27T17:56:29Z) - RCLane: Relay Chain Prediction for Lane Detection [76.62424079494285]
本稿では,リレーチェーン予測に基づく車線検出手法を提案する。
当社の戦略では,TuSimple,CULane,CurveLanes,LLAMASの4つの主要なベンチマーク上で,最先端の新たなベンチマークを確立することが可能です。
論文 参考訳(メタデータ) (2022-07-19T16:48:39Z) - Laneformer: Object-aware Row-Column Transformers for Lane Detection [96.62919884511287]
Laneformerは、自動運転における車線検出に適したトランスフォーマーベースのアーキテクチャである。
様々な視覚タスクにおけるトランスフォーマーエンコーダ・デコーダアーキテクチャの最近の進歩に触発されて、我々は新しいエンドツーエンドのLaneformerアーキテクチャの設計を進める。
論文 参考訳(メタデータ) (2022-03-18T10:14:35Z) - Lane Detection with Versatile AtrousFormer and Local Semantic Guidance [92.83267435275802]
車線検出は自動運転における中核機能の一つである。
既存のほとんどの手法はCNNベースの手法に頼っている。
本稿では,この問題を解決するためにAtrous Transformer (AtrousFormer)を提案する。
論文 参考訳(メタデータ) (2022-03-08T13:25:35Z) - CondLaneNet: a Top-to-down Lane Detection Framework Based on Conditional
Convolution [39.62595444015094]
トップツーダウンのレーン検出フレームワークであるCondLaneNetを提案する。
また,条件付き畳み込みと行毎の定式化に基づく条件付きレーン検出戦略を提案する。
3つのベンチマークデータセットで最新のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-05-11T13:10:34Z) - CurveLane-NAS: Unifying Lane-Sensitive Architecture Search and Adaptive
Point Blending [102.98909328368481]
CurveLane-NASは、レーンに敏感なアーキテクチャ検索フレームワークである。
長距離コヒーレントと正確な短距離曲線情報の両方をキャプチャする。
点ブレンディングによる曲線線予測において、アーキテクチャ探索と後処理の両方を統一する。
論文 参考訳(メタデータ) (2020-07-23T17:23:26Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。