Fugu-MT 論文翻訳(概要): Semantic Aware Feature Extraction for Enhanced 3D Reconstruction

論文の概要: Semantic Aware Feature Extraction for Enhanced 3D Reconstruction

arxiv url: http://arxiv.org/abs/2603.13556v1
Date: Fri, 13 Mar 2026 19:49:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-17 16:19:35.269821
Title: Semantic Aware Feature Extraction for Enhanced 3D Reconstruction
Title（参考訳）: 高度3次元再構成のための意味的認識特徴抽出
Authors: Ronald Nap, Andy Xiao,
Abstract要約: 本研究は,キーポイント検出,キーポイント記述,セマンティックセグメンテーションを併用したマルチタスク学習を用いた意味認識機能抽出フレームワークを提案する。提案手法は高度推定によるセマンティック3次元再構成をサポートし,高度変化を捉え,マルチレベルマッピングを実現する。実験結果から, 本手法は構造的詳細および標高情報を改善した意味的アノテートされた3次元点雲を生成することが示された。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Feature matching is a fundamental problem in computer vision with wide-ranging applications, including simultaneous localization and mapping (SLAM), image stitching, and 3D reconstruction. While recent advances in deep learning have improved keypoint detection and description, most approaches focus primarily on geometric attributes and often neglect higher-level semantic information. This work proposes a semantic-aware feature extraction framework that employs multi-task learning to jointly train keypoint detection, keypoint description, and semantic segmentation. The method is benchmarked against standard feature matching techniques and evaluated in the context of 3D reconstruction. To enhance feature correspondence, a deep matching module is integrated. The system is tested using input from a single monocular fisheye camera mounted on a vehicle and evaluated within a multi-floor parking structure. The proposed approach supports semantic 3D reconstruction with altitude estimation, capturing elevation changes and enabling multi-level mapping. Experimental results demonstrate that the method produces semantically annotated 3D point clouds with improved structural detail and elevation information, underscoring the effectiveness of joint training with semantic cues for more consistent feature matching and enhanced 3D reconstruction.
Abstract（参考訳）: コンピュータビジョンにおける特徴マッチングは、同時局所化とマッピング(SLAM)、画像縫合、三次元再構成など、広範囲の応用における基本的な問題である。近年のディープラーニングの進歩はキーポイントの検出と記述を改善しているが、ほとんどのアプローチは幾何学的属性に重点を置いており、高レベルの意味情報を無視することが多い。本研究は,キーポイント検出,キーポイント記述,セマンティックセグメンテーションを併用したマルチタスク学習を用いた意味認識機能抽出フレームワークを提案する。本手法は,標準的な特徴マッチング手法と比較し,3次元再構成の文脈で評価する。特徴対応性を高めるため、ディープマッチングモジュールが統合される。このシステムは、車両に搭載された単眼の魚眼カメラからの入力を用いてテストされ、マルチフロアの駐車構造で評価される。提案手法は高度推定によるセマンティック3次元再構成をサポートし,高度変化を捉え,マルチレベルマッピングを実現する。実験により, 本手法は, より一貫した特徴マッチングと拡張された3次元再構成のために, セマンティック・キューとの協調訓練の有効性を強調し, 構造的詳細と標高情報を改善した意味的注釈付き3次元点雲を生成することを示した。

関連論文リスト

Unlocking 3D Affordance Segmentation with 2D Semantic Knowledge [45.19482892758984]
Affordance segmentationは、3Dオブジェクトを機能的に異なる部分にパースすることを目的としている。我々は,3次元エンコーダを昇降した2次元意味論と整合させ,再現,親和性,多様性を共同で最適化し,意味的に整理された表現を得るための事前学習戦略であるCross-Modal Affinity Transfer (CMAT)を導入する。さらに,マルチモーダルプロンプトとCMAT対応機能を統合し,高精度かつ迅速なセグメンテーションマップを生成するCAST (Cross-modal Affordance Transformer) を設計する。
論文参考訳（メタデータ） (2025-10-09T15:01:26Z)
Hierarchical Neural Semantic Representation for 3D Semantic Correspondence [72.8101601086805]
階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文参考訳（メタデータ） (2025-09-22T07:23:07Z)
SAB3R: Semantic-Augmented Backbone in 3D Reconstruction [19.236494823612507]
オープン語彙セグメンテーションと3次元再構成の目的を統一する新しいタスクであるMap and Locateを導入する。具体的には、MapとLocateは、未提示のビデオからポイントクラウドを生成し、オープン語彙クエリに基づいてオブジェクトインスタンスをセグメント化する。このタスクは、現実世界のAIアプリケーションへの重要なステップとして機能し、再構築、認識、再編成を橋渡しする実践的なタスクを導入します。
論文参考訳（メタデータ） (2025-06-02T18:00:04Z)
MESC-3D:Mining Effective Semantic Cues for 3D Reconstruction from a Single Image [8.095737075287204]
単一画像からの3次元再構成のためのマイニング有効セマンティックキュース(MESC-3D)と呼ばれる新しい1次元画像再構成法を提案する。具体的には、ポイントクラウドとイメージセマンティック属性間の接続を確立するための効果的なセマンティックマイニングモジュールを設計する。このモジュールは空間構造のセマンティックな理解を取り入れており、モデルがより正確でリアルな3Dオブジェクトを解釈し再構築することができる。
論文参考訳（メタデータ） (2025-02-28T09:02:15Z)
Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。 LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文参考訳（メタデータ） (2024-10-24T17:54:42Z)
SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。 2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文参考訳（メタデータ） (2023-06-28T22:36:44Z)
Improving Point Cloud Semantic Segmentation by Learning 3D Object Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。 Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文参考訳（メタデータ） (2020-09-22T14:17:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。