論文の概要: DiffusionLane: Diffusion Model for Lane Detection
- arxiv url: http://arxiv.org/abs/2510.22236v1
- Date: Sat, 25 Oct 2025 09:42:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.995614
- Title: DiffusionLane: Diffusion Model for Lane Detection
- Title(参考訳): Diffusion Lane: レーン検出のための拡散モデル
- Authors: Kunyang Zhou, Yeqin Shao,
- Abstract要約: DiffusionLaneは、車線検出タスクを、車線のパラメータ空間における分極拡散プロセスとして扱う。
DiffusionLaneは,従来の最先端手法と比較して,強力な一般化能力と有望な検出性能を有することを示す。
- 参考スコア(独自算出の注目度): 5.039849340960836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a novel diffusion-based model for lane detection, called DiffusionLane, which treats the lane detection task as a denoising diffusion process in the parameter space of the lane. Firstly, we add the Gaussian noise to the parameters (the starting point and the angle) of ground truth lanes to obtain noisy lane anchors, and the model learns to refine the noisy lane anchors in a progressive way to obtain the target lanes. Secondly, we propose a hybrid decoding strategy to address the poor feature representation of the encoder, resulting from the noisy lane anchors. Specifically, we design a hybrid diffusion decoder to combine global-level and local-level decoders for high-quality lane anchors. Then, to improve the feature representation of the encoder, we employ an auxiliary head in the training stage to adopt the learnable lane anchors for enriching the supervision on the encoder. Experimental results on four benchmarks, Carlane, Tusimple, CULane, and LLAMAS, show that DiffusionLane possesses a strong generalization ability and promising detection performance compared to the previous state-of-the-art methods. For example, DiffusionLane with ResNet18 surpasses the existing methods by at least 1\% accuracy on the domain adaptation dataset Carlane. Besides, DiffusionLane with MobileNetV4 gets 81.32\% F1 score on CULane, 96.89\% accuracy on Tusimple with ResNet34, and 97.59\% F1 score on LLAMAS with ResNet101. Code will be available at https://github.com/zkyntu/UnLanedet.
- Abstract(参考訳): 本稿では,車線検出タスクを,車線パラメータ空間における除音拡散過程として扱うDiffusion Laneという,車線検出のための新しい拡散モデルを提案する。
まず、ガウス雑音を地中真理車線パラメータ(起点と角度)に加え、ノイズの多い車線アンカーを求め、そのモデルがノイズの多い車線アンカーを段階的に洗練して目標車線を得る。
第二に、ノイズの多いレーンアンカーから生じるエンコーダの特徴表現に対処するハイブリッドデコード戦略を提案する。
具体的には,高品質レーンアンカーにグローバルレベルのデコーダとローカルレベルのデコーダを組み合わせたハイブリッド拡散デコーダを設計する。
そして,エンコーダの特徴表現を改善するために,学習可能なレーンアンカーを用いて,エンコーダの監督を強化する。
Carlane, Tusimple, CULane, LLAMASの4つのベンチマークによる実験結果から, DiffusionLaneは従来の最先端手法と比較して高い一般化能力と有望な検出性能を有することが示された。
例えば、DiffusionLane with ResNet18は、ドメイン適応データセットであるCarlanで、既存のメソッドを少なくとも1倍の精度で上回る。
さらに、MobileNetV4 の DiffusionLane は CULane の 81.32\% F1 スコア、ResNet34 の Tusimple の 96.89\% スコア、ResNet101 の LLAMAS の 97.59\% F1 スコアを得る。
コードはhttps://github.com/zkyntu/UnLanedet.comから入手できる。
関連論文リスト
- Sparse Laneformer [14.198478706372995]
スパースアンカー機構に基づく変圧器を用いた車線検出フレームワークを提案する。
我々は、従来の明示的なアンカーの代わりに、位置対応レーンクエリとアングルクエリを備えたスパースアンカーを生成する。
提案手法はSparse Laneformerと呼ばれ,実装が容易でエンドツーエンドのトレーニングが可能である。
論文 参考訳(メタデータ) (2024-04-11T15:00:55Z) - Faster Diffusion: Rethinking the Role of the Encoder for Diffusion Model Inference [95.42299246592756]
本稿では,UNetエンコーダについて検討し,エンコーダの特徴を実証的に分析する。
エンコーダの特徴は最小限に変化するが,デコーダの特徴は時間段階によって大きく異なる。
我々は、テキスト・ツー・ビデオ、パーソナライズド・ジェネレーション、参照誘導ジェネレーションといった他のタスクに対するアプローチを検証する。
論文 参考訳(メタデータ) (2023-12-15T08:46:43Z) - CLRmatchNet: Enhancing Curved Lane Detection with Deep Matching Process [0.6144680854063939]
レーン検出は、安全なナビゲーションを確保するために重要なデータを提供することによって、自動運転において重要な役割を果たす。
現代のアルゴリズムはアンカーベースの検出器に依存しており、ラベル割り当てプロセスによってトレーニング検出を正または負のインスタンスに分類する。
我々の研究は、ラベル割り当てプロセスを改善することを目的とした、ディープラーニングサブモジュールベースのアプローチであるMatchNetを紹介した。
論文 参考訳(メタデータ) (2023-09-26T19:05:18Z) - CLRerNet: Improving Confidence of Lane Detection with LaneIoU [3.2489082010225485]
我々は,既存の行ベース検出器の予測において,正しい車線位置がすでに存在することを示す。
局所的な車線角を考慮に入れた上で、距離と相関関係が良くなるLaneIoUを提案する。
そこで我々は,LaneIoUを特徴とするCLRerNetという新しい検出器を開発した。
論文 参考訳(メタデータ) (2023-05-15T05:59:35Z) - Denoising Diffusion Autoencoders are Unified Self-supervised Learners [58.194184241363175]
本稿では,拡散モデルにおけるネットワーク,すなわち拡散オートエンコーダ(DDAE)が,自己教師型学習者の統合であることを示す。
DDAEはすでに、補助エンコーダを使わずに、中間層内で線形分離可能な表現を強く学習している。
CIFAR-10 と Tiny-ImageNet の線形評価精度は95.9% と 50.0% である。
論文 参考訳(メタデータ) (2023-03-17T04:20:47Z) - CLRNet: Cross Layer Refinement Network for Lane Detection [36.10035201796672]
レーン検出における高レベル特徴と低レベル特徴の両面をフル活用することを目的としたCross Layer Refinement Network(CLRNet)を提案する。
CLRNetはまず、ハイレベルなセマンティック機能を備えたレーンを検出し、低レベルな機能に基づいて改善を行う。
新たなネットワーク設計に加えて,Line IoU損失(Line IoU損失)を導入し,車線全体を単位として局所化精度を向上させる。
論文 参考訳(メタデータ) (2022-03-19T16:11:35Z) - Lane Detection with Versatile AtrousFormer and Local Semantic Guidance [92.83267435275802]
車線検出は自動運転における中核機能の一つである。
既存のほとんどの手法はCNNベースの手法に頼っている。
本稿では,この問題を解決するためにAtrous Transformer (AtrousFormer)を提案する。
論文 参考訳(メタデータ) (2022-03-08T13:25:35Z) - Diffusion-Based Representation Learning [65.55681678004038]
教師付き信号のない表現学習を実現するために,デノナイズスコアマッチングフレームワークを拡張した。
対照的に、拡散に基づく表現学習は、デノナイジングスコアマッチング目的の新しい定式化に依存している。
同じ手法を用いて,半教師付き画像分類における最先端モデルの改善を実現する無限次元潜在符号の学習を提案する。
論文 参考訳(メタデータ) (2021-05-29T09:26:02Z) - CurveLane-NAS: Unifying Lane-Sensitive Architecture Search and Adaptive
Point Blending [102.98909328368481]
CurveLane-NASは、レーンに敏感なアーキテクチャ検索フレームワークである。
長距離コヒーレントと正確な短距離曲線情報の両方をキャプチャする。
点ブレンディングによる曲線線予測において、アーキテクチャ探索と後処理の両方を統一する。
論文 参考訳(メタデータ) (2020-07-23T17:23:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。