論文の概要: Fine-Grained Representation for Lane Topology Reasoning
- arxiv url: http://arxiv.org/abs/2511.12590v2
- Date: Tue, 18 Nov 2025 16:06:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 13:59:16.784724
- Title: Fine-Grained Representation for Lane Topology Reasoning
- Title(参考訳): レーントポロジー推論のための微粒化表現法
- Authors: Guoqing Xu, Yiheng Li, Yang Yang,
- Abstract要約: 微粒レーントポロジー推論フレームワーク(TopoFG)を提案する。
鳥眼ビュー(Bird's-eye-view, BEV)機能から, きめ細かいクエリによるトポロジー予測に分解する。
OLSは48.0でサブセットAは48.0、サブセットBは45.4である。
- 参考スコア(独自算出の注目度): 9.999635859285341
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Precise modeling of lane topology is essential for autonomous driving, as it directly impacts navigation and control decisions. Existing methods typically represent each lane with a single query and infer topological connectivity based on the similarity between lane queries. However, this kind of design struggles to accurately model complex lane structures, leading to unreliable topology prediction. In this view, we propose a Fine-Grained lane topology reasoning framework (TopoFG). It divides the procedure from bird's-eye-view (BEV) features to topology prediction via fine-grained queries into three phases, i.e., Hierarchical Prior Extractor (HPE), Region-Focused Decoder (RFD), and Robust Boundary-Point Topology Reasoning (RBTR). Specifically, HPE extracts global spatial priors from the BEV mask and local sequential priors from in-lane keypoint sequences to guide subsequent fine-grained query modeling. RFD constructs fine-grained queries by integrating the spatial and sequential priors. It then samples reference points in RoI regions of the mask and applies cross-attention with BEV features to refine the query representations of each lane. RBTR models lane connectivity based on boundary-point query features and further employs a topological denoising strategy to reduce matching ambiguity. By integrating spatial and sequential priors into fine-grained queries and applying a denoising strategy to boundary-point topology reasoning, our method precisely models complex lane structures and delivers trustworthy topology predictions. Extensive experiments on the OpenLane-V2 benchmark demonstrate that TopoFG achieves new state-of-the-art performance, with an OLS of 48.0 on subsetA and 45.4 on subsetB.
- Abstract(参考訳): 車線トポロジーの精密なモデリングは、ナビゲーションや制御の判断に直接影響を与えるため、自動運転に不可欠である。
既存の方法は通常、各レーンを単一のクエリで表現し、レーンクエリ間の類似性に基づいてトポロジ的接続を推測する。
しかし、この種の設計は複雑な車線構造を正確にモデル化するのに苦労し、信頼性の低いトポロジー予測に繋がる。
そこで本研究では,TopoFG(Fen-Grained Lane Topology reasoning framework)を提案する。
鳥眼視(BEV)の特徴から、きめ細かいクエリによるトポロジー予測(HPE)、地域焦点デコーダ(RFD)、ロバスト境界点トポロジカルトポロジカルトポロジカルトポロジカル推論(RBTR)の3つのフェーズに分割する。
具体的には、HPEはBEVマスクからグローバルな空間的先行情報と、それに続くきめ細かなクエリモデリングを導くために、インレーンキーポイントシーケンスから局所的先行情報を抽出する。
RFDは、空間的およびシーケンシャルな前処理を統合することで、きめ細かいクエリを構成する。
次に、マスクのRoI領域の参照ポイントをサンプリングし、各レーンのクエリ表現を洗練するために、BEV機能とのクロスアテンションを適用します。
RBTRは境界点クエリ機能に基づく車線接続をモデル化し、また、一致のあいまいさを低減するためにトポロジ的 denoising 戦略を採用する。
空間的およびシーケンシャルな前処理をきめ細かなクエリに統合し,境界点トポロジ推論に適用することにより,複雑なレーン構造を正確にモデル化し,信頼性の高いトポロジ予測を行う。
OpenLane-V2ベンチマークの大規模な実験は、TopoFGが新しい最先端のパフォーマンスを実現し、サブセットAでは48.0、サブセットBでは45.4であることを示した。
関連論文リスト
- RelTopo: Multi-Level Relational Modeling for Driving Scene Topology Reasoning [74.58385332488227]
道路トポロジー推論は自動運転にとって重要であり、効率的なナビゲーションと交通規制の遵守を可能にする。
既存の手法は通常、レーン検出またはレーン・トゥ・レーン(L2L)のトポロジー推論(英語版)に重点を置いており、しばしばこれらのタスクを共同で最適化するためにレーン・トゥ・トラッフィック・エレメント(L2T)の関係をテキスト化している。
人間は自然に道路要素認識と接続性推論の文脈的関係を利用するので、リレーショナルモデリングは知覚と推論の両方に有益であると主張する。
論文 参考訳(メタデータ) (2025-06-16T14:40:28Z) - Topological Schrödinger Bridge Matching [4.496256885343707]
位相領域上の信号分布の整合性を実現するために, TSBP問題を提案する。
最適過程は、いくつかの未知によって支配されるフォワード・バックワードのダイナミクスに従うことを示す。
我々は、最適過程における未知をニューラルネットワークとしてパラメータ化し、確率訓練により学習することにより、位相信号に一致するTSBベースのモデルを開発する。
論文 参考訳(メタデータ) (2025-04-07T07:45:21Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation [1.2473780585666772]
多くのVision-and-Language Navigation (VLN)アルゴリズムは、視覚的常識の欠如と限られた推論能力のために不正確な決定をする傾向がある。
本稿では,階層的空間近接の知識基盤構築を支援するために,階層的空間近接推論(HSPR)手法を提案する。
我々は、REVERIE、SOON、R2R、R4Rなどの公開データセットで実験を行い、我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-03-18T07:51:22Z) - Joint Bayesian Inference of Graphical Structure and Parameters with a
Single Generative Flow Network [59.79008107609297]
本稿では,ベイジアンネットワークの構造上の結合後部を近似する手法を提案する。
サンプリングポリシが2フェーズプロセスに従う単一のGFlowNetを使用します。
パラメータは後部分布に含まれるため、これは局所確率モデルに対してより柔軟である。
論文 参考訳(メタデータ) (2023-05-30T19:16:44Z) - Relation Matters: Foreground-aware Graph-based Relational Reasoning for
Domain Adaptive Object Detection [81.07378219410182]
我々は、FGRR(Fearground-aware Graph-based Reasoning)というドメインDのための新しい汎用フレームワークを提案する。
FGRRはグラフ構造を検出パイプラインに組み込んで、ドメイン内およびドメイン間フォアグラウンドオブジェクト関係を明示的にモデル化する。
実験の結果、提案したFGRRは4つのDomainDベンチマークの最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-06-06T05:12:48Z) - Average Outward Flux Skeletons for Environment Mapping and Topology
Matching [15.93458380913065]
本研究では,初期未知の2次元環境の道路マップの抽出方法を,その境界線を頑健に計算するオンライン・プロシージャを用いて検討する。
提案アルゴリズムは,ロボットのナビゲーションニーズに対して,スムーズな経路を実現する。
論文 参考訳(メタデータ) (2021-11-27T06:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。