論文の概要: RoadFormer : Local-Global Feature Fusion for Road Surface Classification in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2506.02358v1
- Date: Tue, 03 Jun 2025 01:23:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.192127
- Title: RoadFormer : Local-Global Feature Fusion for Road Surface Classification in Autonomous Driving
- Title(参考訳): RoadFormer : 自律運転における道路表面分類のための局所的・局所的特徴フュージョン
- Authors: Tianze Wang, Zhang Zhang, Chao Sun,
- Abstract要約: 路面タイプ(RSC)の分類は, 路面の粗さ, 湿潤, 乾燥条件, 材料情報を明らかにするために, 舗装の特徴を活用することを目的としている。
自動運転では、正確なRCCにより、車両は道路環境をよりよく理解し、運転戦略を調整し、安全で効率的な運転体験を確保することができる。
本稿では,局所的かつグローバルな特徴情報を,畳み込みモジュールと変圧器モジュールの積み重ねを通じて融合する,自律運転シナリオのための視覚ベースきめ細かなRCC法を提案する。
- 参考スコア(独自算出の注目度): 7.3210301283888315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The classification of the type of road surface (RSC) aims to utilize pavement features to identify the roughness, wet and dry conditions, and material information of the road surface. Due to its ability to effectively enhance road safety and traffic management, it has received widespread attention in recent years. In autonomous driving, accurate RSC allows vehicles to better understand the road environment, adjust driving strategies, and ensure a safer and more efficient driving experience. For a long time, vision-based RSC has been favored. However, existing visual classification methods have overlooked the exploration of fine-grained classification of pavement types (such as similar pavement textures). In this work, we propose a pure vision-based fine-grained RSC method for autonomous driving scenarios, which fuses local and global feature information through the stacking of convolutional and transformer modules. We further explore the stacking strategies of local and global feature extraction modules to find the optimal feature extraction strategy. In addition, since fine-grained tasks also face the challenge of relatively large intra-class differences and relatively small inter-class differences, we propose a Foreground-Background Module (FBM) that effectively extracts fine-grained context features of the pavement, enhancing the classification ability for complex pavements. Experiments conducted on a large-scale pavement dataset containing one million samples and a simplified dataset reorganized from this dataset achieved Top-1 classification accuracies of 92.52% and 96.50%, respectively, improving by 5.69% to 12.84% compared to SOTA methods. These results demonstrate that RoadFormer outperforms existing methods in RSC tasks, providing significant progress in improving the reliability of pavement perception in autonomous driving systems.
- Abstract(参考訳): 路面タイプ(RSC)の分類は,路面の粗さ,湿潤・乾燥条件,材料情報の識別に舗装の特徴を利用することを目的としている。
道路の安全と交通管理を効果的に強化する能力のため、近年は広く注目を集めている。
自動運転では、正確なRCCにより、車両は道路環境をよりよく理解し、運転戦略を調整し、安全で効率的な運転体験を確保することができる。
長い間、視覚ベースのRCCが好まれてきた。
しかし、既存の視覚的分類法は、舗装の種類(同様の舗装テクスチャなど)のきめ細かい分類の探索を見落としている。
本研究では,局所的およびグローバルな特徴情報を,畳み込みモジュールと変圧器モジュールの積み重ねを通じて融合する,自律走行シナリオのための純粋視覚に基づく細粒度RCC法を提案する。
さらに、局所的およびグローバルな特徴抽出モジュールの積み重ね戦略を検討し、最適な特徴抽出戦略を求める。
さらに, 微粒化タスクは, 比較的大きなクラス内差と比較的小さなクラス間差の課題にも直面するため, 複雑な舗装の分類能力を高めるとともに, 舗装の微粒化状況の特徴を効果的に抽出するフォアグラウンド・バックグラウンド・モジュール (FBM) を提案する。
このデータセットから再構成された100万のサンプルと単純化されたデータセットを含む大規模舗装データセットの実験は、それぞれトップ1の分類精度92.52%と96.50%を達成し、SOTA法と比較して5.69%から12.84%改善した。
これらの結果から、RoadFormerはRCCタスクにおける既存の手法よりも優れており、自律運転システムにおける舗装認識の信頼性の向上に大きく貢献することが示された。
関連論文リスト
- Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - Efficient Data Representation for Motion Forecasting: A Scene-Specific Trajectory Set Approach [12.335528093380631]
本研究では,異なる状況に合わせたシーン固有の軌跡セットを生成するための新しい手法を提案する。
決定論的ゴールサンプリングアルゴリズムは関連する地図領域を同定する一方,再帰的分布サブサンプリング (RIDS) 法はトラジェクトリの妥当性を高める。
Argoverse 2データセットの実験では、運転エリアコンプライアンスの最大10%の改善が達成されている。
論文 参考訳(メタデータ) (2024-07-30T11:06:39Z) - Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。
データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - RSRD: A Road Surface Reconstruction Dataset and Benchmark for Safe and
Comfortable Autonomous Driving [67.09546127265034]
道路表面の再構築は、車両の走行計画と制御システムの解析と予測を促進するのに役立つ。
我々は,様々な運転条件下で,特定のプラットフォームで収集した実世界,高解像度,高精度のデータセットであるRoad Surface Reconstructionデータセットを紹介した。
約16,000対のステレオ画像、原点雲、地中深度・不均等地図を含む一般的な道路形態を網羅している。
論文 参考訳(メタデータ) (2023-10-03T17:59:32Z) - R2S100K: Road-Region Segmentation Dataset For Semi-Supervised Autonomous
Driving in the Wild [11.149480965148015]
ロードリージョンデータセット(ロードリージョンデータセット、R2S100K)は、道路セグメンテーションのトレーニングと評価のための大規模データセットおよびベンチマークである。
R2S100Kは、1000KM以上の道路を網羅する大規模で多様なビデオシーケンスから抽出された100K画像からなる。
ラベルのないデータを活用することで学習を改善するための,EDSに基づく効率的なデータサンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-08-11T21:31:37Z) - Leveraging Road Area Semantic Segmentation with Auxiliary Steering Task [0.0]
ステアリングホイール角情報を利用して道路領域のセマンティックセグメンテーションを改善するCNNに基づく手法を提案する。
本稿では,自律運転のための2つの挑戦的データセットに対する提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-12-19T13:25:09Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Model Guided Road Intersection Classification [2.9248680865344348]
本研究は,rgb画像からの区間間分類を,教師・生徒の訓練パラダイムに基づく結果向上手法とともに,統合型ニューラルネットワークを用いて検討する。
KITTIデータセットと新しいKITTI-360シーケンスの両方において、最適な入力構成を特定し、異なるネットワークパラメータを評価することを目的とした広範な実験活動により、本手法はフレーム単位の最先端手法よりも優れ、提案手法の有効性が証明された。
論文 参考訳(メタデータ) (2021-04-26T09:15:28Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in
Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。
本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文 参考訳(メタデータ) (2020-09-22T08:25:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。