論文の概要: Hybrid Cross-Device Localization via Neural Metric Learning and Feature Fusion
- arxiv url: http://arxiv.org/abs/2601.22551v1
- Date: Fri, 30 Jan 2026 04:45:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.22692
- Title: Hybrid Cross-Device Localization via Neural Metric Learning and Feature Fusion
- Title(参考訳): ニューラル・メトリック・ラーニングと特徴融合によるハイブリッドデバイス・クロスデバイス・ローカライゼーション
- Authors: Meixia Lin, Mingkai Liu, Shuxue Peng, Dikai Fan, Shengyu Gu, Xianliang Huang, Haoyang Ye, Xiao Liu,
- Abstract要約: CroCoDL 2025 Challengeのために開発されたハイブリッドデバイスクロスデバイスローカライゼーションパイプラインを提案する。
提案手法では,共有検索エンコーダと2つの補完枝,古典幾何学的分岐とニューラルフィードフォワード分岐を統合した。
最終スコアは92.62(R@0.5m, 5)であった。
- 参考スコア(独自算出の注目度): 7.424207968658674
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a hybrid cross-device localization pipeline developed for the CroCoDL 2025 Challenge. Our approach integrates a shared retrieval encoder and two complementary localization branches: a classical geometric branch using feature fusion and PnP, and a neural feed-forward branch (MapAnything) for metric localization conditioned on geometric inputs. A neural-guided candidate pruning strategy further filters unreliable map frames based on translation consistency, while depth-conditioned localization refines metric scale and translation precision on Spot scenes. These components jointly lead to significant improvements in recall and accuracy across both HYDRO and SUCCU benchmarks. Our method achieved a final score of 92.62 (R@0.5m, 5°) during the challenge.
- Abstract(参考訳): CroCoDL 2025 Challengeのために開発されたハイブリッドデバイスクロスデバイスローカライゼーションパイプラインを提案する。
提案手法は,特徴融合とPnPを用いた古典的幾何学的分枝と,幾何学的入力を条件とした計量的位置決めのためのニューラルフィードフォワード分枝(MapAnything)という,共有検索エンコーダと2つの補完的局所化分枝を統合した。
ニューラル誘導型候補プルーニング戦略は、翻訳一貫性に基づいて信頼できないマップフレームをフィルタリングする一方、深度条件付きローカライゼーションは、Spotのシーンにおけるメートルスケールと翻訳精度を洗練する。
これらのコンポーネントはHYDROとSUCCUベンチマークの両方でリコールと精度が大幅に向上した。
最終スコアは92.62 (R@0.5m, 5°) であった。
関連論文リスト
- UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。
既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。
高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文 参考訳(メタデータ) (2025-12-15T02:59:16Z) - SMGeo: Cross-View Object Geo-Localization with Grid-Level Mixture-of-Experts [4.521626189942935]
クロスビューオブジェクト ジオローカライゼーションは、ドローン画像に基づいて、大規模な衛星画像間で同じ物体を正確に特定することを目的としている。
SMGeoは、オブジェクトジオローカライゼーションのための、高速でエンドツーエンドなトランスフォーマベースモデルである。
論文 参考訳(メタデータ) (2025-11-18T03:21:20Z) - Region-Point Joint Representation for Effective Trajectory Similarity Learning [25.664203648334563]
textbfRePoは、textbfRegion-wiseと textbfPoint-wiseの機能をエンコードして、空間コンテキストと微細な移動パターンの両方をキャプチャする新しい方法である。
実験結果から、RePoはSOTAベースラインよりも22.2%の精度向上を実現していることがわかった。
論文 参考訳(メタデータ) (2025-11-17T08:28:18Z) - Mesh Denoising Transformer [104.5404564075393]
Mesh Denoisingは、入力メッシュからノイズを取り除き、特徴構造を保存することを目的としている。
SurfaceFormerはTransformerベースのメッシュDenoisingフレームワークのパイオニアだ。
局所曲面記述子(Local Surface Descriptor)として知られる新しい表現は、局所幾何学的複雑さをキャプチャする。
Denoising Transformerモジュールは、マルチモーダル情報を受信し、効率的なグローバル機能アグリゲーションを実現する。
論文 参考訳(メタデータ) (2024-05-10T15:27:43Z) - Multiway Point Cloud Mosaicking with Diffusion and Global Optimization [74.3802812773891]
マルチウェイポイントクラウドモザイクのための新しいフレームワーク(水曜日)を紹介する。
我々のアプローチの核心は、重複を識別し、注意点を洗練する学習されたペアワイズ登録アルゴリズムODINである。
4つの多種多様な大規模データセットを用いて、我々の手法は、全てのベンチマークにおいて大きなマージンで、最先端のペアとローテーションの登録結果を比較した。
論文 参考訳(メタデータ) (2024-03-30T17:29:13Z) - Indoor Localization with Robust Global Channel Charting: A
Time-Distance-Based Approach [2.572404739180802]
フィンガープリンティングに基づく位置決めは,非視線優位領域における屋内位置決め性能を著しく向上させる。
チャネルチャート(CC)は明示的な参照情報なしで機能し、チャネル状態情報(CSI)の空間的相関のみを必要とする
ユークリッド距離に対する線形相関にアプローチする時間同期シングルインプット/シングルアウトプットCSIに対して,新しい距離測定法を提案する。
これにより、チャートから実世界の座標への線形変換のみを使用して、CC支援のフィンガープリントと位置決めが可能になる。
論文 参考訳(メタデータ) (2022-10-07T11:07:59Z) - Adaptive Split-Fusion Transformer [90.04885335911729]
本稿では,適応重みによる畳み込みと注目の分岐を異なる方法で扱うための適応分割変換器(ASF-former)を提案する。
ImageNet-1Kのような標準ベンチマークの実験では、我々のASFフォーマーはCNN、トランスフォーマー、ハイブリッドパイロットを精度で上回っている。
論文 参考訳(メタデータ) (2022-04-26T10:00:28Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - Focus on Local: Detecting Lane Marker from Bottom Up via Key Point [10.617793053931964]
本研究では,局所パターンのモデル化とグローバルな構造予測に焦点をあてた新しいレーンマーカー検出ソリューションFOLOLaneを提案する。
具体的には、CNNは2つの異なる頭部を持つ低複雑局所パターンをモデル化し、第1は鍵点の存在を予測し、第2は局所範囲における鍵点の位置を洗練し、同じレーン線の鍵点を相関させる。
論文 参考訳(メタデータ) (2021-05-28T08:59:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。