論文の概要: LaneGraph2Seq: Lane Topology Extraction with Language Model via
Vertex-Edge Encoding and Connectivity Enhancement
- arxiv url: http://arxiv.org/abs/2401.17609v2
- Date: Mon, 19 Feb 2024 15:32:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 03:21:33.716534
- Title: LaneGraph2Seq: Lane Topology Extraction with Language Model via
Vertex-Edge Encoding and Connectivity Enhancement
- Title(参考訳): lanegraph2seq:頂点エッジエンコーディングと接続強化による言語モデルによるレーントポロジー抽出
- Authors: Renyuan Peng, Xinyue Cai, Hang Xu, Jiachen Lu, Feng Wen, Wei Zhang, Li
Zhang
- Abstract要約: 複雑な道路構造は、中心線曲線やDAG(Directed Acyclic Graph)を形成する接続を含むレーングラフを用いて描かれることが多い。
本稿では,レーングラフ抽出の新しいアプローチであるLaneGraph2Seqを紹介する。
本手法は,レーングラフ抽出における最先端技術と比較して優れた性能を示す。
- 参考スコア(独自算出の注目度): 34.017743757153866
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Understanding road structures is crucial for autonomous driving. Intricate
road structures are often depicted using lane graphs, which include centerline
curves and connections forming a Directed Acyclic Graph (DAG). Accurate
extraction of lane graphs relies on precisely estimating vertex and edge
information within the DAG. Recent research highlights Transformer-based
language models' impressive sequence prediction abilities, making them
effective for learning graph representations when graph data are encoded as
sequences. However, existing studies focus mainly on modeling vertices
explicitly, leaving edge information simply embedded in the network.
Consequently, these approaches fall short in the task of lane graph extraction.
To address this, we introduce LaneGraph2Seq, a novel approach for lane graph
extraction. It leverages a language model with vertex-edge encoding and
connectivity enhancement. Our serialization strategy includes a vertex-centric
depth-first traversal and a concise edge-based partition sequence.
Additionally, we use classifier-free guidance combined with nucleus sampling to
improve lane connectivity. We validate our method on prominent datasets,
nuScenes and Argoverse 2, showcasing consistent and compelling results. Our
LaneGraph2Seq approach demonstrates superior performance compared to
state-of-the-art techniques in lane graph extraction.
- Abstract(参考訳): 道路構造を理解することは自動運転にとって不可欠である。
複雑な道路構造は、中心線曲線やDAG(Directed Acyclic Graph)を形成する接続を含むレーングラフを用いて描かれることが多い。
レーングラフの正確な抽出は、DAG内の頂点とエッジ情報を正確に推定することに依存する。
最近の研究はトランスフォーマーに基づく言語モデルの印象的なシーケンス予測能力を強調し、グラフデータをシーケンスとしてエンコードする際のグラフ表現の学習に有効である。
しかし、既存の研究は主に頂点を明示的にモデル化することに焦点を当てており、エッジ情報は単にネットワークに埋め込まれている。
したがって、これらのアプローチはレーングラフ抽出のタスクでは不足する。
これを解決するために、レーングラフ抽出の新しいアプローチであるLaneGraph2Seqを紹介する。
頂点エッジエンコーディングと接続強化を備えた言語モデルを活用する。
我々のシリアライズ戦略は、頂点中心の深度優先トラバーサルと簡潔なエッジベースパーティションシーケンスを含む。
さらに,レーン接続性を改善するために,分類器フリーガイダンスと核サンプリングを併用する。
提案手法を,有意なデータセット,nuScenes,Argoverse 2で検証し,一貫性と説得力のある結果を示した。
lanegraph2seqアプローチは,レーングラフ抽出における最先端技術と比較して優れた性能を示す。
関連論文リスト
- Improving Graph Neural Networks by Learning Continuous Edge Directions [0.0]
グラフニューラルネットワーク(GNN)は、従来、非指向グラフ上の拡散に似たメッセージパッシング機構を採用している。
私たちのキーとなる洞察は、ファジィエッジ方向をグラフのエッジに割り当てることです。
ファジィエッジを持つグラフを学習するためのフレームワークとして,Continuous Edge Direction (CoED) GNNを提案する。
論文 参考訳(メタデータ) (2024-10-18T01:34:35Z) - Enhanced Expressivity in Graph Neural Networks with Lanczos-Based Linear Constraints [7.605749412696919]
グラフニューラルネットワーク(GNN)はグラフ構造化データの処理に優れるが、リンク予測タスクでは性能が劣ることが多い。
グラフラプラシア行列の固有基底に誘導された部分グラフを埋め込むことによりGNNの表現性を高める新しい手法を提案する。
提案手法は,PubMedとOGBL-Vesselのデータセットから,5%と10%のデータしか必要とせず,20倍と10倍の高速化を実現する。
論文 参考訳(メタデータ) (2024-08-22T12:22:00Z) - You Only Transfer What You Share: Intersection-Induced Graph Transfer
Learning for Link Prediction [79.15394378571132]
従来見過ごされていた現象を調査し、多くの場合、元のグラフに対して密に連結された補グラフを見つけることができる。
より密度の高いグラフは、選択的で有意義な知識を伝達するための自然なブリッジを提供する元のグラフとノードを共有することができる。
この設定をグラフインターセクション誘導トランスファーラーニング(GITL)とみなし,eコマースや学術共同オーサシップ予測の実践的応用に動機づけられた。
論文 参考訳(メタデータ) (2023-02-27T22:56:06Z) - Learning and Aggregating Lane Graphs for Urban Automated Driving [26.34702432184092]
レーングラフ推定は、自動走行とHDマップ学習において不可欠で非常に困難な課題である。
本稿では,複数の重なり合うグラフを1つの一貫したグラフに集約する空中画像からレーングラフを推定する新しいボトムアップ手法を提案する。
大規模な都市レーングラフデータセットとコードをhttp://urbanlanegraph.cs.uni-freiburg.deで公開しています。
論文 参考訳(メタデータ) (2023-02-13T08:23:35Z) - Edge but not Least: Cross-View Graph Pooling [76.71497833616024]
本稿では,重要なグラフ構造情報を活用するために,クロスビューグラフプーリング(Co-Pooling)手法を提案する。
クロスビュー相互作用、エッジビュープーリング、ノードビュープーリングにより、相互にシームレスに強化され、より情報的なグラフレベルの表現が学習される。
論文 参考訳(メタデータ) (2021-09-24T08:01:23Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Edge Representation Learning with Hypergraphs [36.03482700241067]
本稿では,グラフのエッジをハイパーグラフのノードに変換するDHT(Dual Hypergraph Transformation)に基づく新しいエッジ表現学習フレームワークを提案する。
グラフ表現と生成性能のための多種多様なグラフデータセット上で,ハイパーグラフを用いたエッジ表現学習法を検証する。
我々のエッジ表現学習とプーリング法はグラフ分類における最先端のグラフプーリング法よりも優れています。
論文 参考訳(メタデータ) (2021-06-30T06:59:05Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Line Graph Neural Networks for Link Prediction [71.00689542259052]
実世界の多くのアプリケーションにおいて古典的なグラフ解析問題であるグラフリンク予測タスクについて検討する。
このフォーマリズムでは、リンク予測問題をグラフ分類タスクに変換する。
本稿では,線グラフをグラフ理論に用いて,根本的に異なる新しい経路を求めることを提案する。
特に、線グラフの各ノードは、元のグラフのユニークなエッジに対応するため、元のグラフのリンク予測問題は、グラフ分類タスクではなく、対応する線グラフのノード分類問題として等価に解決できる。
論文 参考訳(メタデータ) (2020-10-20T05:54:31Z) - Graph Pooling with Node Proximity for Hierarchical Representation
Learning [80.62181998314547]
本稿では,ノード近接を利用したグラフプーリング手法を提案し,そのマルチホップトポロジを用いたグラフデータの階層的表現学習を改善する。
その結果,提案したグラフプーリング戦略は,公開グラフ分類ベンチマークデータセットの集合において,最先端のパフォーマンスを達成できることが示唆された。
論文 参考訳(メタデータ) (2020-06-19T13:09:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。