論文の概要: Visual Place Recognition with Low-Resolution Images
- arxiv url: http://arxiv.org/abs/2305.05776v1
- Date: Tue, 9 May 2023 21:34:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-11 15:13:30.936030
- Title: Visual Place Recognition with Low-Resolution Images
- Title(参考訳): 低解像度画像を用いた視覚位置認識
- Authors: Mihnea-Alexandru Tomita, Bruno Ferrarini, Michael Milford, Klaus
McDonald-Maier, Shoaib Ehsan
- Abstract要約: 画像解像度が手作りビジュアルプレイス認識パイプラインの精度と堅牢性に与える影響を解析する。
本稿では、ハードウェア・ソフトウェア産業の研究者や企業がVPRソリューションを共同設計し、商用製品におけるVPRアルゴリズムの利用を拡大することを目的とする。
- 参考スコア(独自算出の注目度): 17.847661026367767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Images incorporate a wealth of information from a robot's surroundings. With
the widespread availability of compact cameras, visual information has become
increasingly popular for addressing the localisation problem, which is then
termed as Visual Place Recognition (VPR). While many applications use
high-resolution cameras and high-end systems to achieve optimal place-matching
performance, low-end commercial systems face limitations due to resource
constraints and relatively low-resolution and low-quality cameras. In this
paper, we analyse the effects of image resolution on the accuracy and
robustness of well-established handcrafted VPR pipelines. Handcrafted designs
have low computational demands and can adapt to flexible image resolutions,
making them a suitable approach to scale to any image source and to operate
under resource limitations. This paper aims to help academic researchers and
companies in the hardware and software industry co-design VPR solutions and
expand the use of VPR algorithms in commercial products.
- Abstract(参考訳): 画像にはロボットの周囲からの豊富な情報が含まれている。
コンパクトカメラの普及に伴い、視覚情報は、視覚的位置認識(VPR)と呼ばれるローカライゼーション問題に対処するために、ますます人気が高まっている。
多くのアプリケーションは、最適な位置マッチング性能を達成するために高解像度カメラとハイエンドシステムを使用しているが、低解像度の商用システムはリソース制約と比較的低解像度で低品質のカメラのために制限に直面している。
本稿では,手作りVPRパイプラインの精度とロバスト性に及ぼす画像分解能の影響を解析する。
手作りのデザインは計算能力が低く、柔軟な画像解像度に対応し、任意の画像ソースにスケールし、リソース制限下で動作するための適切なアプローチとなる。
本稿では、ハードウェア・ソフトウェア産業の研究者や企業がVPRソリューションを共同設計し、商用製品におけるVPRアルゴリズムの利用を拡大することを目的とする。
関連論文リスト
- Low-Resolution Self-Attention for Semantic Segmentation [96.81482872022237]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - Super-Resolving Face Image by Facial Parsing Information [52.1267613768555]
顔超解像は、低解像度の顔画像を対応する高解像度の画像に変換する技術である。
我々は,低解像度の顔画像から先行する顔を抽出する,新しい解析マップ付き顔超解像ネットワークを構築した。
高解像度特徴はより正確な空間情報を含み、低解像度特徴は強い文脈情報を提供する。
論文 参考訳(メタデータ) (2023-04-06T08:19:03Z) - LSwinSR: UAV Imagery Super-Resolution based on Linear Swin Transformer [7.3817359680010615]
超高分解能技術は無人航空機(UAV)に特に有用である
本稿では,UAV画像の高分解能化のために,最先端のSwin Transformerに基づく新しいネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-17T20:14:10Z) - Improving Performance of Object Detection using the Mechanisms of Visual
Recognition in Humans [0.4297070083645048]
我々はまず、画像解像度の関数として最先端のディープオブジェクト認識ネットワークであるFaster-RCNNの性能を追跡する。
また、認識過程において、異なる空間周波数が物体に関する異なる情報を伝えることも示している。
単分解能ネットワークではなく,多分解能オブジェクト認識フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-23T19:09:36Z) - Efficient High-Resolution Deep Learning: A Survey [90.76576712433595]
スマートフォン、衛星、医療機器などの現代の機器のカメラは、非常に高解像度の画像やビデオを撮影することができる。
このような高解像度データは、がん検出、自動道路ナビゲーション、天気予報、監視、農業プロセスの最適化、その他多くの応用のためのディープラーニングモデルによって処理される。
ディープラーニングモデルの直接入力として高解像度の画像とビデオを使用することで、パラメータの多さ、計算コスト、推論レイテンシ、GPUメモリ使用量など、多くの課題が生じる。
文献におけるいくつかの研究は、高解像度データの課題に対処し、ハードウェアの制限に従いながら精度とスピードを改善するために、より良い代替案を提案する。
論文 参考訳(メタデータ) (2022-07-26T17:13:53Z) - Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text
Spotting [49.33891486324731]
コスト効率の高い動的低分解能蒸留(DLD)テキストスポッティングフレームワークを提案する。
それは、小さなが認識可能な解像度で画像を推測し、精度と効率のバランスを改善することを目的としている。
提案手法はエンド・ツー・エンドを最適化し,既存のテキストスポッティング・フレームワークに実装することで,実践性を向上させる。
論文 参考訳(メタデータ) (2022-07-14T06:49:59Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - Human Pose Estimation on Privacy-Preserving Low-Resolution Depth Images [2.8802646903517957]
HPE(Human pose Estimation)は、オペレーティングルーム(OR)内でAIベースのコンテキスト認識システムを開発するための重要なビルディングブロックである。
低解像度のプライバシー保護画像のみを使用できることは、これらの懸念に対処する。
マルチスケールの超解像ネットワークと2次元のポーズ推定ネットワークを統合するエンド・ツー・エンドのソリューションを提案する。
論文 参考訳(メタデータ) (2020-07-16T14:03:52Z) - Multi-image Super Resolution of Remotely Sensed Images using Residual
Feature Attention Deep Neural Networks [1.3764085113103222]
本研究は,マルチイメージ超解像課題に効果的に取り組む新しい残像注意モデル(RAMS)を提案する。
本研究では,3次元畳み込みによる視覚特徴の注意機構を導入し,意識的なデータ融合と情報抽出を実現する。
我々の表現学習ネットワークは、冗長な低周波信号を流すためにネストした残差接続を広範囲に利用している。
論文 参考訳(メタデータ) (2020-07-06T22:54:02Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。