論文の概要: Smartphone region-wise image indoor localization using deep learning for indoor tourist attraction
- arxiv url: http://arxiv.org/abs/2403.07621v2
- Date: Wed, 12 Jun 2024 14:45:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 22:44:06.872890
- Title: Smartphone region-wise image indoor localization using deep learning for indoor tourist attraction
- Title(参考訳): 深層学習による屋内観光地におけるスマートフォンの地域画像化
- Authors: Gabriel Toshio Hirokawa Higa, Rodrigo Stuqui Monzani, Jorge Fernando da Silva Cecatto, Maria Fernanda Balestieri Mariano de Souza, Vanessa Aparecida de Moraes Weber, Hemerson Pistori, Edson Takashi Matsubara,
- Abstract要約: スマートフォンのGlobal Positional Systemsは、コンクリートや金属ブロックのような密度の高い物質がGPS信号を弱めるシナリオには適さない。
深層学習により、スマートフォン画像を用いて、地域的屋内ローカライゼーションを行うことができる。
本稿では,屋内観光地におけるスマートフォンカメラ画像を用いた深層学習アルゴリズムによる位置の分類を提案する。
- 参考スコア(独自算出の注目度): 4.122197189290759
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Smart indoor tourist attractions, such as smart museums and aquariums, usually require a significant investment in indoor localization devices. The smartphone Global Positional Systems use is unsuitable for scenarios where dense materials such as concrete and metal block weaken the GPS signals, which is the most common scenario in an indoor tourist attraction. Deep learning makes it possible to perform region-wise indoor localization using smartphone images. This approach does not require any investment in infrastructure, reducing the cost and time to turn museums and aquariums into smart museums or smart aquariums. This paper proposes using deep learning algorithms to classify locations using smartphone camera images for indoor tourism attractions. We evaluate our proposal in a real-world scenario in Brazil. We extensively collect images from ten different smartphones to classify biome-themed fish tanks inside the Pantanal Biopark, creating a new dataset of 3654 images. We tested seven state-of-the-art neural networks, three being transformer-based, achieving precision around 90% on average and recall and f-score around 89% on average. The results indicate good feasibility of the proposal in a most indoor tourist attractions.
- Abstract(参考訳): スマートミュージアムや水族館のようなスマートな屋内観光地は、通常屋内のローカライゼーション装置に多大な投資を必要とする。
スマートフォンのGlobal Positional Systemsの使用は、コンクリートや金属ブロックのような密集した物質がGPS信号を弱めるシナリオには適さない。
深層学習により、スマートフォン画像を用いて、地域的屋内ローカライゼーションを行うことができる。
このアプローチはインフラへの投資を一切必要とせず、博物館や水族館をスマート博物館やスマート水族館に変えるコストと時間を削減している。
本稿では,屋内観光地におけるスマートフォンカメラ画像を用いた深層学習アルゴリズムによる位置の分類を提案する。
我々はブラジルの現実世界のシナリオで我々の提案を評価した。
10種類のスマートフォンから画像を収集し、パンタナル・バイオパーク内の生物膜をテーマとした魚槽を分類し、3654枚の画像のデータセットを作成しました。
私たちは7つの最先端ニューラルネットワークをテストし、3つはトランスフォーマーベースで、平均90%の精度でリコール、fスコアは平均89%の精度で達成しました。
この結果は、最も屋内の観光地における提案の良好な実現可能性を示している。
関連論文リスト
- Turn-by-Turn Indoor Navigation for the Visually Impaired [0.0]
室内環境のナビゲーションは視覚障害者にとって重要な課題である。
本稿では,カメラを搭載したスマートフォンのみを用いた建物内部のターンバイターンナビゲーションシステムを提案する。
複雑な屋内空間を利用者に正確に案内するシステムの有効性について予備評価を行った。
論文 参考訳(メタデータ) (2024-10-25T20:16:38Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - A Practical Stereo Depth System for Smart Glasses [27.010252082820017]
本稿では,事前処理,オンラインステレオ修正,ステレオ深度推定を行う生産型エンドツーエンドステレオ深度検知システムを提案する。
深度検知システムの出力は、新しいビュー生成パイプラインで使われ、3次元の計算写真効果が生成される。
トレーニングされたモデルは高速で、6歳のSamsung Galaxy S8のCPU上では1秒未満で動作します。
論文 参考訳(メタデータ) (2022-11-19T01:01:53Z) - Visual Localization via Few-Shot Scene Region Classification [84.34083435501094]
ビジュアル(再)ローカライゼーションは、既知のシーンでキャプチャされたクエリイメージの6-DoFカメラのポーズを推定する問題に対処する。
画像画素からシーン座標へのマッピングを記憶することで,この問題を解決する。
シーン領域の分類手法を提案する。
論文 参考訳(メタデータ) (2022-08-14T22:39:02Z) - DeepLoc: A Ubiquitous Accurate and Low-Overhead Outdoor Cellular
Localization System [6.780776591991887]
DeepLocはディープラーニングベースの屋外ローカライゼーションシステムである。
DeepLocは、都市部では18.8m、農村部では15.7mで、中央値のローカライゼーション精度を達成できる。
この精度は、最先端のセルベースシステムよりも470%以上優れており、GPSと比較して330%の省電力が可能である。
論文 参考訳(メタデータ) (2021-06-25T13:34:40Z) - DeepDarts: Modeling Keypoints as Objects for Automatic Scorekeeping in
Darts using a Single Camera [75.34178733070547]
既存のマルチカメラソリューションは、スチールチップダーツの自動スコア管理に非常に高価であり、ほとんどのプレイヤーにはアクセスできない。
キーポイント検出に対する新しいアプローチを提案し,任意のカメラアングルから撮影した単一の画像からダートスコアを予測する。
我々は、このアイデアにまつわる深い畳み込みニューラルネットワークを開発し、ダート位置とダートボードの校正点を予測する。
論文 参考訳(メタデータ) (2021-05-20T16:25:57Z) - Large-scale Localization Datasets in Crowded Indoor Spaces [23.071409425965772]
実世界の挑戦的環境における視覚的位置決めのための新しい5つの屋内データセットを紹介した。
韓国のソウルにある大型ショッピングモールと大都市圏の駅で捕獲された。
地上の真理カメラの正確なポーズを得るために,ロバストなLiDAR SLAMを開発した。
論文 参考訳(メタデータ) (2021-05-19T06:20:49Z) - EagerMOT: 3D Multi-Object Tracking via Sensor Fusion [68.8204255655161]
マルチオブジェクトトラッキング(MOT)により、移動ロボットは周囲の物体を3次元空間と時間で位置づけすることで、良好な動作計画とナビゲーションを行うことができる。
既存の方法は、深度センサー(例えばLiDAR)を使用して3D空間のターゲットを検出し追跡するが、信号の間隔が限られているため、検出範囲は限られている。
我々は,両方のセンサモダリティから利用可能な物体を全て統合し,シーンのダイナミックスを適切に解釈する簡易なトラッキング定式化であるeagermotを提案する。
論文 参考訳(メタデータ) (2021-04-29T22:30:29Z) - QuickLoc: Adaptive Deep-Learning for Fast Indoor Localization with
Mobile Devices [4.286327408435937]
本稿では,深層学習に基づく屋内定位フレームワークの計算要件を削減する手法を提案する。
提案手法は,複数のスマートフォンに展開し,検証する。
論文 参考訳(メタデータ) (2021-04-15T15:19:21Z) - Memory-Augmented Reinforcement Learning for Image-Goal Navigation [67.3963444878746]
本論文では,クロスエピソードメモリを活用したナビゲーション学習法を提案する。
オーバーフィッティングを避けるため、トレーニング中にRGB入力にデータ拡張を適用することを提案する。
この競合性能はRGB入力のみから得られるが,位置や深度などのセンサは利用できない。
論文 参考訳(メタデータ) (2021-01-13T16:30:20Z) - Learning Depth With Very Sparse Supervision [57.911425589947314]
本稿では, 環境との相互作用を通じて, 知覚が世界の3次元特性と結合するという考えを考察する。
我々は、環境と対話するロボットが利用できるような、特殊なグローバルローカルネットワークアーキテクチャを訓練する。
いくつかのデータセットの実験では、画像ピクセルの1つでも基底真理が利用できる場合、提案されたネットワークは、最先端のアプローチよりも22.5%の精度でモノクロの深度推定を学習できることを示している。
論文 参考訳(メタデータ) (2020-03-02T10:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。