論文の概要: Chameleon: Fast-slow Neuro-symbolic Lane Topology Extraction
- arxiv url: http://arxiv.org/abs/2503.07485v1
- Date: Mon, 10 Mar 2025 16:02:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:47:31.519666
- Title: Chameleon: Fast-slow Neuro-symbolic Lane Topology Extraction
- Title(参考訳): Chameleon: 高速低速神経シンボリックレーントポロジー抽出
- Authors: Zongzheng Zhang, Xinrun Li, Sizhe Zou, Guoxuan Chi, Siqi Li, Xuchong Qiu, Guoliang Wang, Guantian Zheng, Leichen Wang, Hang Zhao, Hao Zhao,
- Abstract要約: レーントポロジ抽出はマップレス自動運転における重要な認識課題である。
視覚言語基礎モデル(VLM)を用いたニューロシンボリック手法を提案する。
そこで我々はChameleonという高速低速ニューロシンボリックレーントポロジー抽出アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 28.160786484629032
- License:
- Abstract: Lane topology extraction involves detecting lanes and traffic elements and determining their relationships, a key perception task for mapless autonomous driving. This task requires complex reasoning, such as determining whether it is possible to turn left into a specific lane. To address this challenge, we introduce neuro-symbolic methods powered by vision-language foundation models (VLMs). Existing approaches have notable limitations: (1) Dense visual prompting with VLMs can achieve strong performance but is costly in terms of both financial resources and carbon footprint, making it impractical for robotics applications. (2) Neuro-symbolic reasoning methods for 3D scene understanding fail to integrate visual inputs when synthesizing programs, making them ineffective in handling complex corner cases. To this end, we propose a fast-slow neuro-symbolic lane topology extraction algorithm, named Chameleon, which alternates between a fast system that directly reasons over detected instances using synthesized programs and a slow system that utilizes a VLM with a chain-of-thought design to handle corner cases. Chameleon leverages the strengths of both approaches, providing an affordable solution while maintaining high performance. We evaluate the method on the OpenLane-V2 dataset, showing consistent improvements across various baseline detectors. Our code, data, and models are publicly available at https://github.com/XR-Lee/neural-symbolic
- Abstract(参考訳): レーントポロジ抽出は、車線と交通要素を検出し、それらの関係を判断する。
このタスクは、左を特定の車線に変えることができるかどうかを判断するなど、複雑な推論を必要とする。
この課題に対処するために,視覚言語基礎モデル(VLM)を用いたニューロシンボリック手法を導入する。
1) VLMによる視覚的プロンプトは高い性能を達成できるが、財政資源と炭素フットプリントの両面でコストがかかるため、ロボット工学の応用では実用的ではない。
2)3次元シーン理解のためのニューロシンボリック推論手法は,プログラムの合成時に視覚入力を統合できないため,複雑なコーナーケースの処理には有効ではない。
そこで本研究では, 合成プログラムを用いて検出されたインスタンスを直接引き起こす高速システムと, コーナーケースの処理にチェーン・オブ・シンボリックなVLMを用いた遅いシステムとを交互に行う, 高速で低速なニューラルシンボリックレーントポロジ抽出アルゴリズムChameleonを提案する。
Chameleonは両方のアプローチの長所を活用し、高性能を維持しながら安価なソリューションを提供する。
提案手法をOpenLane-V2データセット上で評価し,様々なベースライン検出器間で一貫した改善を示す。
私たちのコード、データ、モデルはhttps://github.com/XR-Lee/neural-symbolicで公開されています。
関連論文リスト
- Monocular Lane Detection Based on Deep Learning: A Survey [51.19079381823076]
車線検出は自律運転認識システムにおいて重要な役割を果たす。
ディープラーニングアルゴリズムが普及するにつれて、それらに基づく単眼車線検出法は優れた性能を示した。
本稿では, 成熟度の高い2次元車線検出手法と開発途上国の3次元車線検出技術の両方を網羅して, 既存手法の概要を概説する。
論文 参考訳(メタデータ) (2024-11-25T12:09:43Z) - TopoMLP: A Simple yet Strong Pipeline for Driving Topology Reasoning [51.29906807247014]
トポロジー推論は、道路シーンを理解し、自律運転における乾燥可能なルートを提示することを目的としている。
道路の中心線(車線)と交通要素を検出し、そのトポロジの関係、すなわち車線-車線トポロジと車線-交通トポロジを推論する必要がある。
トポロジー性能の上限を拡張するために,強力な3次元レーン検出器と改良された2次元交通要素検出器を導入する。
論文 参考訳(メタデータ) (2023-10-10T16:24:51Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Graph-based Topology Reasoning for Driving Scenes [102.35885039110057]
TopoNetは、従来の知覚タスクを超えてトラフィック知識を抽象化できる最初のエンドツーエンドフレームワークである。
TopoNetを,難解なシーン理解ベンチマークOpenLane-V2で評価した。
論文 参考訳(メタデータ) (2023-04-11T15:23:29Z) - Penalty-Based Imitation Learning With Cross Semantics Generation Sensor
Fusion for Autonomous Driving [1.2749527861829049]
本稿では,複数の情報モダリティを統合するために,ペナルティに基づく模倣学習手法を提案する。
最新技術(SOTA)モデルであるInterFuserと比較して,運転スコアが12%以上増加していることが観察された。
本モデルでは, 推論速度を7倍に向上し, モデルサイズを約30%削減しながら, この性能向上を実現している。
論文 参考訳(メタデータ) (2023-03-21T14:29:52Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Training Feedback Spiking Neural Networks by Implicit Differentiation on
the Equilibrium State [66.2457134675891]
スパイキングニューラルネットワーク(英: Spiking Neural Network、SNN)は、ニューロモルフィックハードウェア上でエネルギー効率の高い実装を可能にする脳にインスパイアされたモデルである。
既存のほとんどの手法は、人工ニューラルネットワークのバックプロパゲーションフレームワークとフィードフォワードアーキテクチャを模倣している。
本稿では,フォワード計算の正逆性に依存しない新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-29T07:46:54Z) - RESA: Recurrent Feature-Shift Aggregator for Lane Detection [32.246537653680484]
通常のCNNを用いた予備的特徴抽出の後,車線特徴量を高めるために,Recurrent Feature-Shift Aggregator (RESA) という新しいモジュールを提案する。
RESAは、スライスされた特徴写像を集約することで、外観の弱い難解なシナリオでレーンを正確に予測することができる。
提案手法は,2つの人気のある車線検出ベンチマーク(CULaneとTusimple)の最先端結果を実現する。
論文 参考訳(メタデータ) (2020-08-31T16:37:30Z) - Lane Detection Model Based on Spatio-Temporal Network With Double
Convolutional Gated Recurrent Units [11.968518335236787]
レーン検出は今後しばらくは未解決の問題として残るだろう。
二重円錐 Gated Recurrent Units (ConvGRUs) を用いた時空間ネットワークは、困難なシーンにおける車線検出に対処することを提案した。
我々のモデルは最先端の車線検出モデルより優れている。
論文 参考訳(メタデータ) (2020-08-10T06:50:48Z) - EBBINNOT: A Hardware Efficient Hybrid Event-Frame Tracker for Stationary
Dynamic Vision Sensors [5.674895233111088]
本稿では,静止型ニューロモルフィックセンサによって記録された物体を検知・追跡するための複合イベントフレーム手法を提案する。
静的DVSの背景除去特性を活用するために,フレーム内のイベントの有無を通知するイベントベースバイナリ画像生成を提案する。
静止DVSベースのトラフィック監視ソリューションが、同時に記録されたRGBフレームベースの方法と比較されるのは、これが初めてである。
論文 参考訳(メタデータ) (2020-05-31T03:01:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。