論文の概要: TopoMaskV2: Enhanced Instance-Mask-Based Formulation for the Road Topology Problem
- arxiv url: http://arxiv.org/abs/2409.11325v1
- Date: Tue, 17 Sep 2024 16:22:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-18 15:47:40.975649
- Title: TopoMaskV2: Enhanced Instance-Mask-Based Formulation for the Road Topology Problem
- Title(参考訳): TopoMaskV2: 道路トポロジー問題に対するインスタンスマスクに基づく拡張定式化
- Authors: M. Esat Kalfaoglu, Halil Ibrahim Ozturk, Ozsel Kilinc, Alptekin Temizel,
- Abstract要約: TopoMaskは、センターライン予測を強化する新しいアプローチである。
本稿では,フロー情報を用いたマスクインスタンスの強化を目的とした,クワッド指向ラベル表現を提案する。
TopoMaskはOpenLane-V2データセットで最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 3.59986669039879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the centerline has become a popular representation of lanes due to its advantages in solving the road topology problem. To enhance centerline prediction, we have developed a new approach called TopoMask. Unlike previous methods that rely on keypoints or parametric methods, TopoMask utilizes an instance-mask-based formulation coupled with a masked-attention-based transformer architecture. We introduce a quad-direction label representation to enrich the mask instances with flow information and design a corresponding post-processing technique for mask-to-centerline conversion. Additionally, we demonstrate that the instance-mask formulation provides complementary information to parametric Bezier regressions, and fusing both outputs leads to improved detection and topology performance. Moreover, we analyze the shortcomings of the pillar assumption in the Lift Splat technique and adapt a multi-height bin configuration. Experimental results show that TopoMask achieves state-of-the-art performance in the OpenLane-V2 dataset, increasing from 44.1 to 49.4 for Subset-A and 44.7 to 51.8 for Subset-B in the V1.1 OLS baseline.
- Abstract(参考訳): 近年,道路トポロジ問題を解く上での利点から,幹線道路の表現が普及している。
中心線予測を強化するため,我々は TopoMask という新しいアプローチを開発した。
キーポイントやパラメトリックメソッドに依存する従来の方法とは異なり、TopoMaskは、マスク付きアテンションベースのトランスフォーマーアーキテクチャと組み合わせたインスタンスマスクベースの定式化を使用している。
本稿では,フロー情報によるマスクインスタンスの強化を目的としたクアッド指向ラベル表現を導入し,マスクから中心への変換を行うための処理後手法を設計する。
さらに、インスタンスマスクの定式化はパラメトリックベジエ回帰に相補的な情報を提供し、両方の出力を融合させることで検出およびトポロジー性能が向上することを示した。
さらに,Lft Splat法における柱仮定の欠点を分析し,多重ビン構成を適用した。
実験の結果、TopoMaskはOpenLane-V2データセットで最先端のパフォーマンスを達成し、Subset-Aでは44.1から49.4に、V1.1 OLSベースラインでは44.7から51.8に増加した。
関連論文リスト
- Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Implicit-ARAP: Efficient Handle-Guided Deformation of High-Resolution Meshes and Neural Fields via Local Patch Meshing [18.353444950896527]
本稿では,ニューラルサインされた距離場に対する局所パッチメッシュ表現について述べる。
この技術は、フラットパッチメッシュをレベルセット面に投影し変形させることにより、入力SDFのレベルセットの局所領域を識別することができる。
我々は,高分解能メッシュとニューラルフィールドのAs-Rigid-As-Possible変形を計算するために,3次元ニューラルネットワークを利用する2つの異なるパイプラインを導入する。
論文 参考訳(メタデータ) (2024-05-21T16:04:32Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - TopoMask: Instance-Mask-Based Formulation for the Road Topology Problem
via Transformer-Based Architecture [4.970364068620607]
道路トポロジにおける中心線予測のためのTopoMaskを紹介する。
TopoMaskはOpenLane-V2スコア(OLS)で4位、OpenLane Topology Challenge 2023ではF1スコアで2位にランクインしている。
論文 参考訳(メタデータ) (2023-06-08T17:58:57Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Accurate Polygonal Mapping of Buildings in Satellite Imagery [30.262871819346213]
本稿では,マスク可逆性の問題に対処して,建物の多角写像問題について検討する。
本稿では,異なるレベルの監視信号から得られる特徴埋め込みの新たな相互作用機構を提案し,可逆なビルディングマスクを得る。
学習した可逆的なビルディングマスクは、ビルの高機能多角形マッピングのための深層畳み込みニューラルネットワークの進歩の恩恵を享受できることを示す。
論文 参考訳(メタデータ) (2022-08-01T04:54:55Z) - SODAR: Segmenting Objects by DynamicallyAggregating Neighboring Mask
Representations [90.8752454643737]
最近の最先端のワンステージインスタンスセグメンテーションモデルSOLOは、入力画像をグリッドに分割し、完全な畳み込みネットワークを備えたグリッドセルオブジェクトマスクを直接予測する。
我々は,SOLOが近傍の格子セルの物体に対して類似したマスクを生成するのを観察する。
観測されたギャップによってモチベーションを得た学習ベースのアグリゲーション手法を開発し,そのリッチな隣り合う情報を活用してSOLOを改善する。
論文 参考訳(メタデータ) (2022-02-15T13:53:03Z) - Pyramid Fusion Transformer for Semantic Segmentation [44.57867861592341]
マルチスケール特徴量を持つマスク毎のセマンティックセマンティックセグメンテーションのためのトランスフォーマベースピラミッドフュージョントランス (PFT) を提案する。
広く使われている3つのセマンティックセグメンテーションデータセット上での競合性能を実現する。
論文 参考訳(メタデータ) (2022-01-11T16:09:25Z) - Towards Accurate Pixel-wise Object Tracking by Attention Retrieval [50.06436600343181]
本稿では,バックボーンの特徴に対するソフト空間制約を実現するために,アテンション検索ネットワーク(ARN)を提案する。
私たちは40fpsで動作しながら、最近のピクセルワイドオブジェクトトラッキングベンチマークであるVOT 2020に最先端のベンチマークを新たに設定しました。
論文 参考訳(メタデータ) (2020-08-06T16:25:23Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。