論文の概要: APS: A Large-Scale Multi-Modal Indoor Camera Positioning System
- arxiv url: http://arxiv.org/abs/2102.04139v1
- Date: Mon, 8 Feb 2021 11:37:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:38:51.425546
- Title: APS: A Large-Scale Multi-Modal Indoor Camera Positioning System
- Title(参考訳): APS:大規模マルチモード屋内カメラポジショニングシステム
- Authors: Ali Ghofrani, Rahil Mahdian Toroghi, Seyed Mojtaba Tabatabaie
- Abstract要約: APS(Alpha Positioning System)と呼ばれる大規模屋内位置決めのための新しいエンドツーエンドシステムの提案がされている。
Pix2Pix GANネットワークを統合して、入力されたクエリ画像のポイントクラウド対を、カメラの位置と回転情報をしっかりと推定するために、ディープCNNネットワークと再構築する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Navigation inside a closed area with no GPS-signal accessibility is a highly
challenging task. In order to tackle this problem, recently the imaging-based
methods have grabbed the attention of many researchers. These methods either
extract the features (e.g. using SIFT, or SOSNet) and map the descriptive ones
to the camera position and rotation information, or deploy an end-to-end system
that directly estimates this information out of RGB images, similar to PoseNet.
While the former methods suffer from heavy computational burden during the test
process, the latter suffers from lack of accuracy and robustness against
environmental changes and object movements. However, end-to-end systems are
quite fast during the test and inference and are pretty qualified for
real-world applications, even though their training phase could be longer than
the former ones. In this paper, a novel multi-modal end-to-end system for
large-scale indoor positioning has been proposed, namely APS (Alpha Positioning
System), which integrates a Pix2Pix GAN network to reconstruct the point cloud
pair of the input query image, with a deep CNN network in order to robustly
estimate the position and rotation information of the camera. For this
integration, the existing datasets have the shortcoming of paired RGB/point
cloud images for indoor environments. Therefore, we created a new dataset to
handle this situation. By implementing the proposed APS system, we could
achieve a highly accurate camera positioning with a precision level of less
than a centimeter.
- Abstract(参考訳): gps信号のアクセシビリティのないクローズドエリア内のナビゲーションは、非常に難しいタスクです。
この問題に対処するため,近年,イメージングベースの手法が多くの研究者の注目を集めている。
これらの方法は特徴(例えば)を抽出する。
SIFT(SOSNet)を使用して、説明的なものをカメラの位置と回転情報にマッピングするか、あるいはPoseNetのようなRGBイメージから直接この情報を推定するエンドツーエンドシステムを展開する。
前者は試験過程において計算負荷が重いが,後者は環境変化や物体の動きに対する精度と頑健さの欠如に悩まされている。
しかしながら、エンドツーエンドのシステムはテストと推論の間は非常に高速で、トレーニングフェーズが以前のシステムよりも長いとしても、現実世界のアプリケーションにはかなり適しています。
本論文では,Pix2Pix GANネットワークを統合して,入力クエリ画像の点群対を深層CNNネットワークで再構築し,カメラの位置と回転情報を堅牢に推定する,大規模屋内測位用マルチモーダルエンドツーエンドシステムであるAPS(Alpha Positioning System)を提案する。
この統合のために、既存のデータセットには、屋内環境向けのペアリングRGB /ポイントクラウドイメージの欠点があります。
そのため、この状況に対処するために新しいデータセットを作成しました。
提案するapsシステムを実装することで,精度1cm未満の高精度カメラ位置決めを実現することができた。
関連論文リスト
- Solving Short-Term Relocalization Problems In Monocular Keyframe Visual SLAM Using Spatial And Semantic Data [1.2937020918620652]
本稿では,単眼カメラシステムを用いた移動ロボットのロバストな短期的再ローカライズ機能の開発に焦点をあてる。
環境中で検出されたオブジェクトのセマンティック情報を含む、新しいマルチモーダルディスクリプタが導入された。
この記述子を用いて,マルチステージフィルタリングアルゴリズムとして定式化された新しいキーフレームベースのPlace Recognition (KPR)法を提案する。
論文 参考訳(メタデータ) (2024-07-28T15:54:37Z) - Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - Anyview: Generalizable Indoor 3D Object Detection with Variable Frames [63.51422844333147]
我々は,AnyViewという新しい3D検出フレームワークを実用化するために提案する。
本手法は, 単純かつクリーンなアーキテクチャを用いて, 高い一般化性と高い検出精度を実現する。
論文 参考訳(メタデータ) (2023-10-09T02:15:45Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - Fast and Lightweight Scene Regressor for Camera Relocalization [1.6708069984516967]
プレビルドされた3Dモデルに対して直接カメラのポーズを推定することは、いくつかのアプリケーションにとって違法にコストがかかる可能性がある。
本研究では,シーン座標のマッピングに多層パーセプトロンネットワークのみを必要とする簡易なシーン回帰手法を提案する。
提案手法では,高密度のRGB画像ではなく,スパースディスクリプタを用いてシーン座標を回帰する。
論文 参考訳(メタデータ) (2022-12-04T14:41:20Z) - A Flexible-Frame-Rate Vision-Aided Inertial Object Tracking System for
Mobile Devices [3.4836209951879957]
本稿では,モバイルデバイス用フレキシブルフレームレートオブジェクトポーズ推定とトラッキングシステムを提案する。
高速トラッキングのためにクライアント側で慣性計測ユニット(IMU)ポーズ伝搬を行い、サーバ側でRGB画像ベースの3Dポーズ推定を行う。
我々のシステムは120FPSまでのフレキシブルフレームレートをサポートし、ローエンドデバイス上での高精度かつリアルタイムなトラッキングを保証する。
論文 参考訳(メタデータ) (2022-10-22T15:26:50Z) - VPIT: Real-time Embedded Single Object 3D Tracking Using Voxel Pseudo Images [90.60881721134656]
本稿では,Voxel Pseudo Image Tracking (VPIT) という,Voxel-based 3D Single Object Tracking (3D SOT) 手法を提案する。
KITTI追跡データセットの実験は、VPITが最速の3D SOT法であり、競合的な成功と精度の値を維持することを示している。
論文 参考訳(メタデータ) (2022-06-06T14:02:06Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文 参考訳(メタデータ) (2020-09-17T08:23:50Z) - Event-based Stereo Visual Odometry [42.77238738150496]
ステレオ・イベント・ベースのカメラ・リグが取得したデータから視覚計測の問題に対する解決策を提案する。
我々は,シンプルかつ効率的な表現を用いて,ステレオイベントベースのデータの時間的一貫性を最大化する。
論文 参考訳(メタデータ) (2020-07-30T15:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。