論文の概要: GeoReFormer: Geometry-Aware Refinement for Lane Segment Detection and Topology Reasoning
- arxiv url: http://arxiv.org/abs/2603.26018v1
- Date: Fri, 27 Mar 2026 02:26:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.330266
- Title: GeoReFormer: Geometry-Aware Refinement for Lane Segment Detection and Topology Reasoning
- Title(参考訳): GeoReFormer: レーンセグメント検出とトポロジー推論のための幾何認識リファインメント
- Authors: Danny Abraham, Nikhil Kamalkumar Advani, Arun Das, Nikil Dutt,
- Abstract要約: GeoReFormerは、幾何学とトポロジを意識した帰納バイアスをトランスフォーマーデコーダに直接埋め込むクエリベースのアーキテクチャである。
GeoReFormerは、OpenLane-V2ベンチマークで34.5%のmAPで最先端のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 0.7769712273444055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate 3D lane segment detection and topology reasoning are critical for structured online map construction in autonomous driving. Recent transformer-based approaches formulate this task as query-based set prediction, yet largely inherit decoder designs originally developed for compact object detection. However, lane segments are continuous polylines embedded in directed graphs, and generic query initialization and unconstrained refinement do not explicitly encode this geometric and relational structure. We propose GeoReFormer (Geometry-aware Refinement Transformer), a unified query-based architecture that embeds geometry- and topology-aware inductive biases directly within the transformer decoder. GeoReFormer introduces data-driven geometric priors for structured query initialization, bounded coordinate-space refinement for stable polyline deformation, and per-query gated topology propagation to selectively integrate relational context. On the OpenLane-V2 benchmark, GeoReFormer achieves state-of-the-art performance with 34.5% mAP while improving topology consistency over strong transformer baselines, demonstrating the utility of explicit geometric and relational structure encoding.
- Abstract(参考訳): 正確な3次元車線セグメント検出とトポロジー推論は、自律運転における構造化オンラインマップ構築に不可欠である。
近年のトランスフォーマーベースのアプローチでは、このタスクをクエリベースのセット予測として定式化しているが、元々はコンパクトなオブジェクト検出のために開発されたデコーダの設計をほとんど継承している。
しかし、レーンセグメントは有向グラフに埋め込まれた連続ポリラインであり、汎用的なクエリ初期化と制約のない洗練は、この幾何学的および関係的な構造を明示的にエンコードしていない。
また,GeoReFormer (Geometry-aware Refinement Transformer) を提案する。
GeoReFormerは、構造化クエリ初期化のためのデータ駆動幾何学的先行処理、安定したポリライン変形のための境界座標空間の洗練、および関係コンテキストを選択的に統合するためのクエリごとのゲートトポロジ伝搬を導入している。
OpenLane-V2ベンチマークでは、GeoReFormerは34.5% mAPで最先端のパフォーマンスを達成し、強力なトランスフォーマーベースラインのトポロジー一貫性を改善し、明示的な幾何学的およびリレーショナル構造エンコーディングの有用性を実証した。
関連論文リスト
- GGPT: Geometry Grounded Point Transformer [22.64445696362087]
本稿では,GGPT(Geometry-Grounded Point Transformer)について紹介する。
この基礎の上に構築された幾何誘導型3次元点変換器は,比例的な部分幾何学的監督の下で高密度点マップを洗練する。
論文 参考訳(メタデータ) (2026-03-11T18:00:04Z) - ArGEnT: Arbitrary Geometry-encoded Transformer for Operator Learning [2.757490632589873]
本稿では、任意のドメイン上での演算子学習のための幾何認識型アテンションベースアーキテクチャであるArbitrary Geometry-encoded Transformer (ArGEnT)を提案する。
柔軟な幾何符号化と演算子学習機能を組み合わせることで、ArGEnTは複雑な物理システムの最適化、不確実性、データ駆動モデリングのためのスケーラブルな代理モデリングフレームワークを提供する。
論文 参考訳(メタデータ) (2026-02-12T06:22:59Z) - GFLAN: Generative Functional Layouts [1.1458853556386797]
GFLANは、フロアプラン合成を明示的な因子化によって、トポロジカルプランニングと幾何学的実現に再構成する生成フレームワークである。
提案手法は,2段階分解の原理を優先して,直接画素間あるいは壁面追跡生成から逸脱する。
論文 参考訳(メタデータ) (2025-12-18T07:52:47Z) - GeoGNN: Quantifying and Mitigating Semantic Drift in Text-Attributed Graphs [59.61242815508687]
テキスト分散グラフ(TAG)上のグラフニューラルネットワーク(GNN)は、事前訓練された言語モデル(PLM)を使用してノードテキストを符号化し、これらの埋め込みを線形近傍アグリゲーションを通じて伝播する。
本研究は,意味的ドリフトの度合いを計測する局所PCAベースの計量を導入し,異なる凝集機構が多様体構造にどのように影響するかを解析するための最初の定量的枠組みを提供する。
論文 参考訳(メタデータ) (2025-11-12T06:48:43Z) - CAT: Curvature-Adaptive Transformers for Geometry-Aware Learning [0.0]
Curvature-Adaptive Transformer (CAT) は、軽量で微分可能なゲーティング機構を通じて、3つの幾何学的注意枝にまたがるトーケン毎のルーティングを学習する。
知識グラフ補完ベンチマークでは、CATは最小限のオーバーヘッドで固定幾何ベースラインに対して、MRRとHits@10の約10%の改善を実現している。
論文 参考訳(メタデータ) (2025-10-02T03:26:33Z) - Matching Shapes Under Different Topologies: A Topology-Adaptive Deformation Guided Approach [6.851721795186258]
非厳密な3Dメッシュマッチングは、コンピュータビジョンとコンピュータグラフィックスパイプラインにおける重要なステップである。
トポロジカルアーティファクトを含むメッシュに取り組み、現在のアプローチによる仮定を破ることができる。
私たちは、しばしばトポロジカルなアーティファクトに悩まされる、フレームごとのマルチビュー再構築のような現実世界のシナリオに動機付けられています。
提案手法は, 従来のデータ駆動手法に頼らず, 3次元アライメント品質の大規模データセットでトレーニングした手法よりも, ノイズの多いフレーム単位のマルチビュー再構成を含む, トポロジカルアーチファクトの非等尺形状や形状に適用される。
論文 参考訳(メタデータ) (2025-09-08T16:29:44Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - GTA: A Geometry-Aware Attention Mechanism for Multi-View Transformers [63.41460219156508]
既存の位置符号化方式は3次元視覚タスクに最適であると主張する。
トークンの幾何学的構造を相対変換として符号化する幾何学的注意機構を提案する。
我々は、Geometric Transform Attention (GTA) と呼ばれる、最先端のトランスフォーマーベースNVSモデルの学習効率と性能を向上させることに留意している。
論文 参考訳(メタデータ) (2023-10-16T13:16:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。