論文の概要: PoCo: Point Context Cluster for RGBD Indoor Place Recognition
- arxiv url: http://arxiv.org/abs/2404.02885v1
- Date: Wed, 3 Apr 2024 17:38:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 16:40:30.950057
- Title: PoCo: Point Context Cluster for RGBD Indoor Place Recognition
- Title(参考訳): PoCo:RGBD屋内位置認識のためのポイントコンテキストクラスタ
- Authors: Jing Liang, Zhuo Deng, Zheming Zhou, Omid Ghasemalizadeh, Dinesh Manocha, Min Sun, Cheng-Hao Kuo, Arnie Sen,
- Abstract要約: 本稿では,屋内RGB-D位置認識タスクのための新しいエンドツーエンドアルゴリズム(PoCo)を提案する。
本稿では,最近のコンテキスト・オブ・クラスタ(CoC)を一般化したネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 47.12179061883084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel end-to-end algorithm (PoCo) for the indoor RGB-D place recognition task, aimed at identifying the most likely match for a given query frame within a reference database. The task presents inherent challenges attributed to the constrained field of view and limited range of perception sensors. We propose a new network architecture, which generalizes the recent Context of Clusters (CoCs) to extract global descriptors directly from the noisy point clouds through end-to-end learning. Moreover, we develop the architecture by integrating both color and geometric modalities into the point features to enhance the global descriptor representation. We conducted evaluations on public datasets ScanNet-PR and ARKit with 807 and 5047 scenarios, respectively. PoCo achieves SOTA performance: on ScanNet-PR, we achieve R@1 of 64.63%, a 5.7% improvement from the best-published result CGis (61.12%); on Arkit, we achieve R@1 of 45.12%, a 13.3% improvement from the best-published result CGis (39.82%). In addition, PoCo shows higher efficiency than CGis in inference time (1.75X-faster), and we demonstrate the effectiveness of PoCo in recognizing places within a real-world laboratory environment.
- Abstract(参考訳): 本稿では,屋内RGB-D位置認識タスクのための新しいエンドツーエンドアルゴリズム(PoCo)を提案する。
このタスクは、視野の制約や知覚センサーの制限による固有の課題を提示する。
本稿では,最近のコンテキスト・オブ・クラスタ(CoC)を一般化したネットワークアーキテクチャを提案する。
さらに,グローバルな記述子表現を強化するために,色と幾何学的モダリティをポイント特徴に統合してアーキテクチャを開発する。
公開データセットであるScanNet-PRとARKitをそれぞれ807シナリオと5047シナリオで評価した。
ScanNet-PRでは64.63%のR@1、ベストパブリッシュされた結果CGis(61.12%)から5.7%の改善、Arkitでは45.12%のR@1、ベストパブリッシュされた結果CGis(39.82%)から13.3%の改善。
また,PoCoは推定時間(1.75倍高速)においてCGisよりも高い効率を示し,実環境下での認識におけるPoCoの有効性を示した。
関連論文リスト
- CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition [47.12179061883084]
本稿では,RGB-D屋内位置認識のための新しいアルゴリズムであるCSCPRを提案する。
主にRGBドメインに焦点を当てた従来のアプローチとは異なり、CSCPRはRGB-Dデータを扱うように設計されている。
ノイズの多い色の点雲を扱うためのコンテキスト・オブ・クラスタ(CoC)を拡張し、再ランク付けのための2つの新しいモジュールを導入します。
論文 参考訳(メタデータ) (2024-07-24T17:50:00Z) - The Chronicles of RAG: The Retriever, the Chunk and the Generator [0.0]
本稿では,ブラジルポルトガル語のRAGの実装,最適化,評価を行うための優れたプラクティスを提案する。
我々は最初のハリー・ポッターの本についての質問に答えるための様々な方法を探究する。
論文 参考訳(メタデータ) (2024-01-15T18:25:18Z) - Improving Visual Grounding by Encouraging Consistent Gradient-based
Explanations [58.442103936918805]
注意マスク整合性は,従来の方法よりも優れた視覚的グラウンドリング結果が得られることを示す。
AMCは効率的で実装が容易であり、どんな視覚言語モデルでも採用できるため一般的である。
論文 参考訳(メタデータ) (2022-06-30T17:55:12Z) - CGS-Net: Aggregating Colour, Geometry and Semantic Features for
Large-Scale Indoor Place Recognition [6.156387608994791]
大規模屋内位置認識へのアプローチとして,低レベルな色と幾何学的特徴を高レベルなセマンティック特徴で集約する手法を提案する。
我々は、RGBポイントクラウドを取り込み、ローカル機能を5つの3次元カーネルポイント畳み込み層で抽出するディープラーニングネットワークを使用している。
具体的には、セマンティックセグメンテーションタスク上でKPConv層をトレーニングし、抽出したローカル機能がセマンティックに意味があることを保証する。
論文 参考訳(メタデータ) (2022-02-04T10:51:25Z) - ZARTS: On Zero-order Optimization for Neural Architecture Search [94.41017048659664]
微分可能なアーキテクチャサーチ (DARTS) は、NASの高効率性のため、一般的なワンショットパラダイムである。
この作業はゼロオーダーの最適化に変わり、上記の近似を強制せずに探索するための新しいNASスキームであるZARTSを提案する。
特に、12ベンチマークの結果は、DARTSの性能が低下するZARTSの顕著な堅牢性を検証する。
論文 参考訳(メタデータ) (2021-10-10T09:35:15Z) - LoGG3D-Net: Locally Guided Global Descriptor Learning for 3D Place
Recognition [31.105598103211825]
追加のトレーニング信号(局所的整合性損失)が、リビジョン間で一貫性のある局所的特徴の学習にネットワークを導くことができることを示す。
私たちは、LoGG3D-Netと呼ばれるエンドツーエンドのトレーニング可能なアーキテクチャでアプローチを定式化します。
論文 参考訳(メタデータ) (2021-09-17T03:32:43Z) - Cyclic Differentiable Architecture Search [99.12381460261841]
微分可能なArchiTecture Search(DARTS)は、ニューラルアーキテクチャサーチにおいて大きな注目を集めている。
我々はCDARTSと呼ばれる新しい共同目標と新しい周期微分可能なArchiTecture Searchフレームワークを提案する。
DARTS検索の分野では、CIFAR10で97.52%、ImageNetで76.3%、トップ1で76.3%の精度を達成した。
論文 参考訳(メタデータ) (2020-06-18T17:55:19Z) - Learning Delicate Local Representations for Multi-Person Pose Estimation [77.53144055780423]
我々はResidual Steps Network (RSN) と呼ばれる新しい手法を提案する。
RSNは同じ空間サイズ(イントラレベルの特徴)の機能を効率よく集約し、微妙な局所表現を得る。
当社のアプローチは,COCO Keypoint Challenge 2019で第1位を獲得しました。
論文 参考訳(メタデータ) (2020-03-09T10:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。