論文の概要: 3dSAGER: Geospatial Entity Resolution over 3D Objects (Technical Report)
- arxiv url: http://arxiv.org/abs/2511.06300v1
- Date: Sun, 09 Nov 2025 09:35:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.874749
- Title: 3dSAGER: Geospatial Entity Resolution over 3D Objects (Technical Report)
- Title(参考訳): 3dSAGER: 3Dオブジェクト上の地理空間エンティティ分解能(技術報告)
- Authors: Bar Genossar, Sagi Dalyot, Roee Shraga, Avigdor Gal,
- Abstract要約: 3dSAGERは3Dオブジェクト上の空間的エンティティ解決のためのエンドツーエンドパイプラインである。
本稿では,マッチングペアの複雑な幾何学的特徴をキャプチャする,空間参照非依存のデファクトチュール化機構を提案する。
また、訓練されたモデルを活用して、ハイリコール候補セットを効率的に生成する、軽量で解釈可能な新しいブロッキング手法であるBKAFIを提案する。
- 参考スコア(独自算出の注目度): 7.378893412842889
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Urban environments are continuously mapped and modeled by various data collection platforms, including satellites, unmanned aerial vehicles and street cameras. The growing availability of 3D geospatial data from multiple modalities has introduced new opportunities and challenges for integrating spatial knowledge at scale, particularly in high-impact domains such as urban planning and rapid disaster management. Geospatial entity resolution is the task of identifying matching spatial objects across different datasets, often collected independently under varying conditions. Existing approaches typically rely on spatial proximity, textual metadata, or external identifiers to determine correspondence. While useful, these signals are often unavailable, unreliable, or misaligned, especially in cross-source scenarios. To address these limitations, we shift the focus to the intrinsic geometry of 3D spatial objects and present 3dSAGER (3D Spatial-Aware Geospatial Entity Resolution), an end-to-end pipeline for geospatial entity resolution over 3D objects. 3dSAGER introduces a novel, spatial-reference-independent featurization mechanism that captures intricate geometric characteristics of matching pairs, enabling robust comparison even across datasets with incompatible coordinate systems where traditional spatial methods fail. As a key component of 3dSAGER, we also propose a new lightweight and interpretable blocking method, BKAFI, that leverages a trained model to efficiently generate high-recall candidate sets. We validate 3dSAGER through extensive experiments on real-world urban datasets, demonstrating significant gains in both accuracy and efficiency over strong baselines. Our empirical study further dissects the contributions of each component, providing insights into their impact and the overall design choices.
- Abstract(参考訳): 都市環境は衛星、無人航空機、ストリートカメラなど、さまざまなデータ収集プラットフォームによって継続的にマッピングされ、モデル化されている。
複数のモダリティからの3次元地理空間データの利用が増加し、特に都市計画や急激な災害管理といった高負荷領域において、大規模に空間知識を統合する新たな機会と課題がもたらされた。
地理空間的実体分解(Geospatial entity resolution)は、異なるデータセットにまたがる空間的オブジェクトを識別するタスクであり、しばしば異なる条件下で独立して収集される。
既存のアプローチは通常、対応を決定するために、空間的近接性、テキストメタデータ、または外部識別子に依存している。
有用ではあるが、これらの信号は、特にクロスソースシナリオにおいて、しばしば利用できない、信頼できない、あるいは不一致である。
これらの制約に対処するため、3次元空間オブジェクトの内在幾何学に焦点を移し、3dSAGER(Spatial-Aware Geospatial Entity Resolution)を3次元オブジェクト上の空間実体分解のためのエンドツーエンドパイプラインとして提示する。
3dSAGERは、マッチングペアの複雑な幾何学的特徴をキャプチャし、従来の空間メソッドが失敗する不整合座標系を持つデータセットでさえも堅牢な比較を可能にする、新しい空間参照非依存の成果化機構を導入している。
また, 3dSAGER の重要な構成要素として, 訓練されたモデルを利用してハイリコール候補集合を効率的に生成する, 軽量かつ解釈可能な新しいブロッキング手法 BKAFI を提案する。
我々は3dSAGERを実世界の都市データセットの広範な実験により検証し、強いベースラインに対する精度と効率の両方において有意な向上を示した。
私たちの実証的研究は、各コンポーネントの貢献をさらに識別し、その影響と全体的な設計選択に関する洞察を与えます。
関連論文リスト
- Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting [64.64738535860351]
単一ビュー画像を包括的・スケール的・外観リアルな3D表現に変換するスケーラブルなパイプラインを提案する。
本手法は,画像の膨大な保存と空間的シーン理解への需要の増大とのギャップを埋めるものである。
画像から精度の高い3Dデータを自動的に生成することにより,データ収集コストを大幅に削減し,空間知性を向上するための新たな道を開く。
論文 参考訳(メタデータ) (2025-07-24T14:53:26Z) - Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [9.411542547451193]
本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文 参考訳(メタデータ) (2025-06-17T07:04:07Z) - Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data [14.104497777255137]
本稿では,3つのイノベーションを取り入れた高効率空間スペクトル変換器について紹介する。
位置マスキングとチャネルマスキングを統合したHyperspectral Masked Autoencoderフレームワークを用いたLESS ViTの事前訓練を行った。
実験により, 提案手法は, 最先端のマルチモーダル地空間基盤モデルと競合する性能を示す。
論文 参考訳(メタデータ) (2025-03-17T05:42:19Z) - GREAT: Geometry-Intention Collaborative Inference for Open-Vocabulary 3D Object Affordance Grounding [53.42728468191711]
Open-Vocabulary 3D object affordance groundingは、任意の命令で3Dオブジェクト上のアクション可能性の領域を予測することを目的としている。
GREAT (GeometRy-intEntion collAboraTive Inference) を提案する。
論文 参考訳(メタデータ) (2024-11-29T11:23:15Z) - Towards Unified 3D Object Detection via Algorithm and Data Unification [70.27631528933482]
我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。