論文の概要: Segment Anything Model for Road Network Graph Extraction
- arxiv url: http://arxiv.org/abs/2403.16051v1
- Date: Sun, 24 Mar 2024 07:36:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 17:45:32.024287
- Title: Segment Anything Model for Road Network Graph Extraction
- Title(参考訳): 道路網グラフ抽出のためのセグメンテーションモデル
- Authors: Congrui Hetang, Haoru Xue, Cindy Le, Tianwei Yue, Wenping Wang, Yihui He,
- Abstract要約: 衛星画像から大規模でベクトル化された道路網グラフを抽出するためのSAM-Roadを提案する。
SAM-Roadは単純で単純で最小限の設計で、最先端のRNGDet++で同等の精度を実現している。
- 参考スコア(独自算出の注目度): 27.789980798493463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose SAM-Road, an adaptation of the Segment Anything Model (SAM) for extracting large-scale, vectorized road network graphs from satellite imagery. To predict graph geometry, we formulate it as a dense semantic segmentation task, leveraging the inherent strengths of SAM. The image encoder of SAM is fine-tuned to produce probability masks for roads and intersections, from which the graph vertices are extracted via simple non-maximum suppression. To predict graph topology, we designed a lightweight transformer-based graph neural network, which leverages the SAM image embeddings to estimate the edge existence probabilities between vertices. Our approach directly predicts the graph vertices and edges for large regions without expensive and complex post-processing heuristics, and is capable of building complete road network graphs spanning multiple square kilometers in a matter of seconds. With its simple, straightforward, and minimalist design, SAM-Road achieves comparable accuracy with the state-of-the-art method RNGDet++, while being 40 times faster on the City-scale dataset. We thus demonstrate the power of a foundational vision model when applied to a graph learning task. The code is available at https://github.com/htcr/sam_road.
- Abstract(参考訳): 衛星画像から大規模でベクトル化された道路網グラフを抽出するためのSAM-Roadを提案する。
グラフ幾何を予測するために、SAMの固有の強みを活用して、密接なセマンティックセマンティックセグメンテーションタスクとして定式化する。
SAMの画像エンコーダは、道路や交差点の確率マスクを生成するように微調整され、そこからグラフ頂点を単純な非最大抑圧によって抽出する。
グラフトポロジを予測するために,SAM画像の埋め込みを利用して頂点間のエッジ存在確率を推定する,軽量なトランスフォーマーベースグラフニューラルネットワークを設計した。
提案手法は,高価で複雑な後処理ヒューリスティックを伴わない大規模領域のグラフ頂点とエッジを直接予測し,数平方キロメートルにまたがる完全な道路網グラフを数秒で構築することができる。
SAM-Roadはシンプルで単純で最小限の設計で、最先端のRNGDet++で同等の精度を実現し、City-scaleデータセットの40倍高速である。
そこで我々は,グラフ学習タスクに適用した場合,基礎的視覚モデルのパワーを実証する。
コードはhttps://github.com/htcr/sam_road.comで公開されている。
関連論文リスト
- Towards Satellite Image Road Graph Extraction: A Global-Scale Dataset and A Novel Method [42.3609654615897]
我々は,グローバルスケールの衛星道路グラフ抽出データセット,すなわちグローバルスケールデータセットを収集する。
ノード誘導再サンプリング方式を採用した新しい道路グラフ抽出モデルであるSAM-Road++を開発した。
実験では,収集したGlobal-ScaleデータセットとSAM-Road++法の有効性を示す。
論文 参考訳(メタデータ) (2024-11-23T10:26:07Z) - Graph Transformers for Large Graphs [57.19338459218758]
この研究は、モデルの特徴と重要な設計制約を識別することに焦点を当てた、単一の大規模グラフでの表現学習を前進させる。
この研究の重要な革新は、局所的な注意機構と組み合わされた高速な近傍サンプリング技術の作成である。
ogbn-products と snap-patents の3倍の高速化と16.8%の性能向上を報告し、ogbn-100M で LargeGT を5.9% の性能改善で拡張した。
論文 参考訳(メタデータ) (2023-12-18T11:19:23Z) - RNGDet++: Road Network Graph Detection by Transformer with Instance
Segmentation and Multi-scale Features Enhancement [19.263691277963368]
道路網のグラフ構造は、グローバルな計画、動き予測、制御など、自律運転システムの下流業務に不可欠である。
これまでは、道路ネットワークグラフは人の専門家によって手動で注釈付けされていた。
前者は、プロセス後セマンティックセグメンテーションマップや、ロードネットワークグラフを直接予測するグラフベースのアルゴリズムを提案している。
それまでの作業は、ハードコードされた処理アルゴリズムと劣った最終性能に悩まされていた。
提案されたアプローチはRNGDetから改善されているため、RNGDet++と呼ばれている。
論文 参考訳(メタデータ) (2022-09-21T07:06:46Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - RNGDet: Road Network Graph Detection by Transformer in Aerial Images [19.141279413414082]
道路ネットワークグラフは、自動運転車アプリケーションにとって重要な情報を提供する。
手動でアノテートする道路ネットワークグラフは非効率で労働集約的です。
RNGDetという変圧器と模倣学習に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-16T01:59:41Z) - MGAE: Masked Autoencoders for Self-Supervised Learning on Graphs [55.66953093401889]
Masked Graph Autoencoder (MGAE) フレームワークは、グラフ構造データの効果的な学習を行う。
自己指導型学習から洞察を得て、私たちはランダムに大量のエッジを隠蔽し、トレーニング中に欠落したエッジを再構築しようとします。
論文 参考訳(メタデータ) (2022-01-07T16:48:07Z) - Road Extraction from Overhead Images with Graph Neural Networks [18.649284163019516]
本稿では,最終道路グラフを1パスで直接推測する手法を提案する。
鍵となるアイデアは、関心点の特定を担当する完全な畳み込みネットワークと、これらのポイント間のリンクを予測するグラフニューラルネットワークを組み合わせることである。
我々は,一般的なRoadTracerデータセット上の既存の作業に対して評価を行い,競合する結果を得た。
論文 参考訳(メタデータ) (2021-12-09T21:10:27Z) - SPIN Road Mapper: Extracting Roads from Aerial Images via Spatial and
Interaction Space Graph Reasoning for Autonomous Driving [64.10636296274168]
道路抽出は、自律航法システムを構築するための重要なステップである。
この問題に対して単に畳み込みニューラルネットワーク(ConvNets)を使用することは、画像内の道路セグメント間の遠い依存関係をキャプチャする非効率であるため、効果がない。
本研究では,ConvNetに接続した時,特徴写像から投影された空間空間および相互作用空間上に構築されたグラフの推論を行う空間空間グラフ推論(SPIN)モジュールを提案する。
論文 参考訳(メタデータ) (2021-09-16T03:52:17Z) - Road Scene Graph: A Semantic Graph-Based Scene Representation Dataset
for Intelligent Vehicles [72.04891523115535]
本稿では,車載用特別シーングラフである道路シーングラフを提案する。
オブジェクトの提案だけでなく、ペアワイドな関係も提供します。
それらをトポロジカルグラフで整理することで、これらのデータは説明可能であり、完全に接続され、GCNによって容易に処理できる。
論文 参考訳(メタデータ) (2020-11-27T07:33:11Z) - Sat2Graph: Road Graph Extraction through Graph-Tensor Encoding [25.55895733077606]
本稿では,従来の2つのカテゴリの利点を統一的なフレームワークに組み合わせた新たな手法であるSat2Graphを提案する。
Sat2Graphのキーとなるアイデアは、道路グラフをテンソル表現にエンコードする新しいエンコーディングスキーム、グラフテンソルエンコーディング(GTE)である。
Sat2Graphは、TOPOとAPLSという2つの広く使われているメトリクスで、従来の手法を上回ります。
論文 参考訳(メタデータ) (2020-07-19T01:04:19Z) - Block-Approximated Exponential Random Graphs [77.4792558024487]
指数乱グラフ(ERG)の分野における重要な課題は、大きなグラフ上の非自明なERGの適合である。
本稿では,非自明なERGに対する近似フレームワークを提案する。
我々の手法は、数百万のノードからなるスパースグラフにスケーラブルである。
論文 参考訳(メタデータ) (2020-02-14T11:42:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。