Fugu-MT 論文翻訳(概要): CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition

論文の概要: CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition

arxiv url: http://arxiv.org/abs/2407.17457v1
Date: Wed, 24 Jul 2024 17:50:00 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-25 12:55:41.686379
Title: CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition
Title（参考訳）: CSCPR: クロスソースコンテキスト屋内RGB-D位置認識
Authors: Jing Liang, Zhuo Deng, Zheming Zhou, Min Sun, Omid Ghasemalizadeh, Cheng-Hao Kuo, Arnie Sen, Dinesh Manocha,
Abstract要約: 本稿では,RGB-D屋内位置認識のための新しいアルゴリズムであるCSCPRを提案する。主にRGBドメインに焦点を当てた従来のアプローチとは異なり、CSCPRはRGB-Dデータを扱うように設計されている。ノイズの多い色の点雲を扱うためのコンテキスト・オブ・クラスタ(CoC)を拡張し、再ランク付けのための2つの新しいモジュールを導入します。
参考スコア（独自算出の注目度）: 47.12179061883084
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a new algorithm, Cross-Source-Context Place Recognition (CSCPR), for RGB-D indoor place recognition that integrates global retrieval and reranking into a single end-to-end model. Unlike prior approaches that primarily focus on the RGB domain, CSCPR is designed to handle the RGB-D data. We extend the Context-of-Clusters (CoCs) for handling noisy colorized point clouds and introduce two novel modules for reranking: the Self-Context Cluster (SCC) and Cross Source Context Cluster (CSCC), which enhance feature representation and match query-database pairs based on local features, respectively. We also present two new datasets, ScanNetIPR and ARKitIPR. Our experiments demonstrate that CSCPR significantly outperforms state-of-the-art models on these datasets by at least 36.5% in Recall@1 at ScanNet-PR dataset and 44% in new datasets. Code and datasets will be released.
Abstract（参考訳）: 本稿では,グローバル検索を統合したRGB-D屋内位置認識のための新しいアルゴリズムであるクロスソース・コンテキスト認識(CSCPR)を提案する。主にRGBドメインに焦点を当てた従来のアプローチとは異なり、CSCPRはRGB-Dデータを扱うように設計されている。ノイズの多い色付き点雲を扱うためのコンテキスト・オブ・クラスタ(CoC)を拡張し、それぞれローカル機能に基づいて特徴表現とクエリ・データベースのペアをマッチングするセルフ・コンテキスト・クラスタ(SCC)とクロス・ソース・コンテキスト・クラスタ(CSCC)の2つの新しいモジュールを導入します。また、ScanNetIPRとARKitIPRという2つの新しいデータセットも提示する。我々の実験は、CSCPRがこれらのデータセットの最先端モデルを、ScanNet-PRデータセットのRecall@1で少なくとも36.5%、新しいデータセットで44%大きく上回っていることを示した。コードとデータセットがリリースされる。

関連論文リスト

RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker [4.235252053339947]
本稿では,新しいRGB-Sonar(RGB-S)トラッキングタスクを提案する。 RGBとソナーモダリティの相互作用により、水中の標的の効率的な追跡を実現する方法について検討する。
論文参考訳（メタデータ） (2024-06-11T12:01:11Z)
PoCo: Point Context Cluster for RGBD Indoor Place Recognition [47.12179061883084]
本稿では,屋内RGB-D位置認識タスクのための新しいエンドツーエンドアルゴリズム(PoCo)を提案する。本稿では,最近のコンテキスト・オブ・クラスタ(CoC)を一般化したネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2024-04-03T17:38:15Z)
Benchmarking Implicit Neural Representation and Geometric Rendering in Real-Time RGB-D SLAM [6.242958695705305]
インプシット・ニューラル表現(INR)と幾何学的レンダリングの組み合わせは、リアルタイム高密度RGB-D SLAMに採用されている。我々は、広く使われているINRとレンダリング関数の幅広いスペクトルの性能を評価するための、最初のオープンソースのベンチマークフレームワークを構築した。 RGB-D SLAMシステムに対応するために,高忠実度高密度グリッドマッピングのための明示的なハイブリッド符号化を提案する。
論文参考訳（メタデータ） (2024-03-28T14:59:56Z)
CalibNet: Dual-branch Cross-modal Calibration for RGB-D Salient Instance Segmentation [88.50067783122559]
CalibNetは3つの単純なモジュール、動的インタラクティブカーネル(DIK)と重量共有融合(WSF)で構成されている。実験の結果、CalibNetは、COME15K-Nテストセット上で320*480の入力サイズを持つ58.0% APという有望な結果をもたらすことが示された。
論文参考訳（メタデータ） (2023-07-16T16:49:59Z)
Revisiting Color-Event based Tracking: A Unified Network, Dataset, and Metric [53.88188265943762]
上記の機能を同時に実現したCEUTrack(Color-Event Unified Tracking)のためのシングルステージバックボーンネットワークを提案する。提案するCEUTrackはシンプルで,効率的で,75FPS以上を達成し,新たなSOTA性能を実現している。
論文参考訳（メタデータ） (2022-11-20T16:01:31Z)
CIR-Net: Cross-modality Interaction and Refinement for RGB-D Salient Object Detection [144.66411561224507]
本稿では,CIR-Netと呼ばれる畳み込みニューラルネットワーク(CNN)モデルを提案する。我々のネットワークは、定性的かつ定量的に最先端の塩分濃度検出器より優れています。
論文参考訳（メタデータ） (2022-10-06T11:59:19Z)
CRCNet: Few-shot Segmentation with Cross-Reference and Region-Global Conditional Networks [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。複数ショットセグメンテーションのためのクロスリファレンス・ローカル・グローバル・ネットワーク(CRCNet)を提案する。我々のネットワークは、相互参照機構により、2つの画像に共起する物体をよりよく見つけることができる。
論文参考訳（メタデータ） (2022-08-23T06:46:18Z)
Self-Supervised Representation Learning for RGB-D Salient Object Detection [93.17479956795862]
我々は、自己教師付き表現学習を用いて、クロスモーダルオートエンコーダと深さ-輪郭推定という2つのプレテキストタスクを設計する。我々のプレテキストタスクは、ネットワークがリッチなセマンティックコンテキストをキャプチャする事前トレーニングを実行するのに、少数のRGB-Dデータセットしか必要としない。 RGB-D SODにおけるクロスモーダル核融合の固有の問題として,マルチパス核融合モジュールを提案する。
論文参考訳（メタデータ） (2021-01-29T09:16:06Z)
Bi-directional Cross-Modality Feature Propagation with Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文参考訳（メタデータ） (2020-07-17T18:35:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。