Fugu-MT 論文翻訳(概要): Robust Lane Detection through Self Pre-training with Masked Sequential Autoencoders and Fine-tuning with Customized PolyLoss

論文の概要: Robust Lane Detection through Self Pre-training with Masked Sequential Autoencoders and Fine-tuning with Customized PolyLoss

arxiv url: http://arxiv.org/abs/2305.17271v2
Date: Fri, 11 Aug 2023 08:35:06 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-14 16:53:16.797457
Title: Robust Lane Detection through Self Pre-training with Masked Sequential Autoencoders and Fine-tuning with Customized PolyLoss
Title（参考訳）: マスク付きシークエンシャルオートエンコーダによる自己事前学習によるロバストレーン検出とカスタマイズポリロスによる微調整
Authors: Ruohan Li, Yongqi Dong
Abstract要約: 車線検出は、自動走行の基礎となる車両のローカライゼーションに不可欠である。本稿では、エンドツーエンドニューラルネットワークモデルのための自己学習マスク付きシーケンシャルオートエンコーダと、カスタマイズされたPolyLossによる微調整のパイプラインを提案する。実験の結果,提案したパイプラインでは,車線検出モデルの性能は最先端以上のものとなることがわかった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Lane detection is crucial for vehicle localization which makes it the foundation for automated driving and many intelligent and advanced driving assistant systems. Available vision-based lane detection methods do not make full use of the valuable features and aggregate contextual information, especially the interrelationships between lane lines and other regions of the images in continuous frames. To fill this research gap and upgrade lane detection performance, this paper proposes a pipeline consisting of self pre-training with masked sequential autoencoders and fine-tuning with customized PolyLoss for the end-to-end neural network models using multi-continuous image frames. The masked sequential autoencoders are adopted to pre-train the neural network models with reconstructing the missing pixels from a random masked image as the objective. Then, in the fine-tuning segmentation phase where lane detection segmentation is performed, the continuous image frames are served as the inputs, and the pre-trained model weights are transferred and further updated using the backpropagation mechanism with customized PolyLoss calculating the weighted errors between the output lane detection results and the labeled ground truth. Extensive experiment results demonstrate that, with the proposed pipeline, the lane detection model performance on both normal and challenging scenes can be advanced beyond the state-of-the-art, delivering the best testing accuracy (98.38%), precision (0.937), and F1-measure (0.924) on the normal scene testing set, together with the best overall accuracy (98.36%) and precision (0.844) in the challenging scene test set, while the training time can be substantially shortened.
Abstract（参考訳）: 車線検出は、自動運転と多くのインテリジェントで高度な運転支援システムの基礎となる車両のローカライゼーションに不可欠である。利用可能な視覚に基づく車線検出手法は、貴重な特徴をフル活用せず、特に連続フレームにおける車線線と画像の他の領域間の相互関係を集約する。この研究ギャップを埋め、レーン検出性能を向上するために、マスク付きシーケンシャルオートエンコーダによる自己事前学習と、マルチ連続画像フレームを用いたエンドツーエンドニューラルネットワークモデルのためのカスタマイズされたPolyLossによる微調整からなるパイプラインを提案する。マスク付きシーケンシャルオートエンコーダを用いてニューラルネットワークモデルを事前訓練し、目的とするランダムマスク画像から欠落した画素を再構成する。そして、レーン検出セグメンテーションが行われる微調整セグメンテーションフェーズにおいて、連続した画像フレームを入力として提供し、予め訓練されたモデル重みを、出力されたレーン検出結果とラベル付き基底真理との重み付き誤差を算出するカスタマイズされたポリロスによりバックプロパゲーション機構を用いて、さらに更新する。提案したパイプラインでは、通常シーンと挑戦シーンの両方における車線検出モデルの性能が最先端を超えて向上し、通常のシーンテストセットにおける最高のテスト精度(98.38%)、精度(0.937)、F1測定(0.924)、そして挑戦シーンテストセットにおける最高の総合精度(98.36%)、精度(0.844)を実現し、トレーニング時間を著しく短縮できることを示した。

関連論文リスト

DriveFlow: Rectified Flow Adaptation for Robust 3D Object Detection in Autonomous Driving [85.14946767994932]
DriveFlowは、自律運転におけるデータ強化をトレーニングするためのRectified Flow Adaptation法である。これは、精密な3次元オブジェクト形状を維持するために、フォアグラウンドの高周波アライメント損失を組み込む。また、バックグラウンドをデュアル周波数で最適化し、編集の柔軟性とセマンティック一貫性のバランスをとる。
論文参考訳（メタデータ） (2025-11-24T03:12:43Z)
Improving Real-Time Concept Drift Detection using a Hybrid Transformer-Autoencoder Framework [0.0]
応用機械学習では、概念ドリフトはモデルの性能を著しく低下させる。本研究では,複雑な時間力学をモデル化するためのトランスフォーマーとオートエンコーダを組み合わせたハイブリッドフレームワークを提案する。以上の結果から,トランスフォーメーション・オートエンコーダは,文献で一般的に用いられるオートエンコーダよりも早く,より感度の高いドリフトを検出した。
論文参考訳（メタデータ） (2025-08-09T19:39:33Z)
Lane-Wise Highway Anomaly Detection [8.086502588472783]
本稿では,車線道路交通異常検出のためのスケーラブルかつ解釈可能なフレームワークを提案する。従来のセンサ依存の手法とは異なり、我々の手法はAIを利用した視覚モデルを用いて車線固有の特徴を抽出する。我々のフレームワークは、精度、リコール、F1スコアにおいて最先端の手法より優れています。
論文参考訳（メタデータ） (2025-05-05T12:32:23Z)
Segment-Level Road Obstacle Detection Using Visual Foundation Model Priors and Likelihood Ratios [4.578773000079989]
現在の道路障害物検出方法は各画素にスコアを割り当て、しきい値を適用して最終的な予測を生成する。道路障害物を直接予測するために,視覚基盤モデルと確率比からセグメントレベルの特徴を利用する新しい手法を提案する。個々の画素ではなくセグメントに注目することにより,検出精度を高め,偽陽性を低減し,シーンの変動性にロバスト性を高める。
論文参考訳（メタデータ） (2024-12-07T17:40:20Z)
Cross-Camera Distracted Driver Classification through Feature Disentanglement and Contrastive Learning [13.613407983544427]
車両内のカメラ位置の変化に耐えられるような頑健なモデルを導入する。我々のドライバ行動監視ネットワーク(DBMNet)は軽量なバックボーンに依存し、アンタングルメントモジュールを統合する。 100-Driverデータセットの夜間および夜間のサブセットで行った実験は、我々のアプローチの有効性を検証した。
論文参考訳（メタデータ） (2024-11-20T10:27:12Z)
Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文参考訳（メタデータ） (2024-04-11T10:26:40Z)
Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning [8.042684255871707]
本稿では,車線描画画像の異常検出を分類問題に変換する。本研究では,データ前処理,マスク付き画像モデリング(MiM)手法による自己教師付き事前学習,ラベル平滑化によるクロスエントロピーベース損失を用いた微調整,後処理からなる4相パイプラインを提案する。その結果,提案パイプラインは車線描画画像異常検出において優れた性能を示すことがわかった。
論文参考訳（メタデータ） (2023-12-07T16:10:10Z)
Nighttime Driver Behavior Prediction Using Taillight Signal Recognition via CNN-SVM Classifier [2.44755919161855]
本研究の目的は、人間駆動車と自律車の両方のテールライトを特定し、夜間運転行動を予測する能力を高めることである。提案モデルでは、道路の前方のテールライトを正確に検出するカスタム検出器が組み込まれている。夜間の限られたデータに対処するため、昼間の画像をリアルな夜のイメージに変換するために、ユニークな画素ワイズ画像処理技術を実装した。
論文参考訳（メタデータ） (2023-10-25T15:23:33Z)
Unsupervised Domain Adaptation for Self-Driving from Past Traversal Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。実世界のデータセットの実験では、大幅な改善が示されている。
論文参考訳（メタデータ） (2023-09-21T15:00:31Z)
Driver Maneuver Detection and Analysis using Time Series Segmentation and Classification [7.413735713939367]
本稿では,自然主義運転環境下での車両遠隔計測データから車両の操作を自動的に検出する手法を実装した。本研究の目的は、自然主義駆動学習ビデオのフレーム・バイ・フレームアノテーションのためのエンドツーエンドパイプラインを開発することである。
論文参考訳（メタデータ） (2022-11-10T03:38:50Z)
Unsupervised Foggy Scene Understanding via Self Spatial-Temporal Label Diffusion [51.11295961195151]
運転シーンの霧画像列の特徴を利用して、自信ある擬似ラベルを密度化する。局所的な空間的類似性と逐次画像データの隣接時間対応の2つの発見に基づいて,新たなターゲット・ドメイン駆動擬似ラベル拡散方式を提案する。本手法は,2つの天然霧のデータセット上で51.92%,53.84%の平均交叉結合(mIoU)を達成するのに有効である。
論文参考訳（メタデータ） (2022-06-10T05:16:50Z)
Deep traffic light detection by overlaying synthetic context on arbitrary natural images [49.592798832978296]
深部交通光検出器のための人工的な交通関連トレーニングデータを生成する手法を提案する。このデータは、任意の画像背景の上に偽のトラフィックシーンをブレンドするために、基本的な非現実的なコンピュータグラフィックスを用いて生成される。また、交通信号データセットの本質的なデータ不均衡問題にも対処し、主に黄色い状態のサンプルの少なさによって引き起こされる。
論文参考訳（メタデータ） (2020-11-07T19:57:22Z)
RONELD: Robust Neural Network Output Enhancement for Active Lane Detection [1.3965477771846408]
最近の最先端車線検出アルゴリズムは、畳み込みニューラルネットワーク(CNN)を用いてディープラーニングモデルを訓練している。アクティブレーン検出(RONELD)のための実時間ロバストニューラルネットワーク出力向上手法を提案する。 RONELDの精度は最大2倍に向上した。
論文参考訳（メタデータ） (2020-10-19T14:22:47Z)
Deep Traffic Sign Detection and Recognition Without Target Domain Real Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文参考訳（メタデータ） (2020-07-30T21:06:47Z)
Road Curb Detection and Localization with Monocular Forward-view Vehicle Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文参考訳（メタデータ） (2020-02-28T00:24:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。