論文の概要: Data Efficient Visual Place Recognition Using Extremely JPEG-Compressed
Images
- arxiv url: http://arxiv.org/abs/2209.08343v1
- Date: Sat, 17 Sep 2022 14:46:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 18:00:47.599196
- Title: Data Efficient Visual Place Recognition Using Extremely JPEG-Compressed
Images
- Title(参考訳): JPEG圧縮画像を用いた効率的な画像位置認識
- Authors: Mihnea-Alexandru Tomita, Bruno Ferrarini, Michael Milford, Klaus
McDonald-Maier, Shoaib Ehsan
- Abstract要約: 本稿では,JPEG圧縮が視覚的位置認識技術の性能に与える影響について検討する。
圧縮を導入することにより、特に高い圧縮スペクトルにおいて、VPR性能が大幅に低下することを示す。
我々は、JPEG圧縮データに最適化された微調整CNNを提案し、非常に圧縮されたJPEG画像で検出された画像変換とより一貫した性能を示す。
- 参考スコア(独自算出の注目度): 17.847661026367767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Place Recognition (VPR) is the ability of a robotic platform to
correctly interpret visual stimuli from its on-board cameras in order to
determine whether it is currently located in a previously visited place,
despite different viewpoint, illumination and appearance changes. JPEG is a
widely used image compression standard that is capable of significantly
reducing the size of an image at the cost of image clarity. For applications
where several robotic platforms are simultaneously deployed, the visual data
gathered must be transmitted remotely between each robot. Hence, JPEG
compression can be employed to drastically reduce the amount of data
transmitted over a communication channel, as working with limited bandwidth for
VPR can be proven to be a challenging task. However, the effects of JPEG
compression on the performance of current VPR techniques have not been
previously studied. For this reason, this paper presents an in-depth study of
JPEG compression in VPR related scenarios. We use a selection of
well-established VPR techniques on 8 datasets with various amounts of
compression applied. We show that by introducing compression, the VPR
performance is drastically reduced, especially in the higher spectrum of
compression. To overcome the negative effects of JPEG compression on the VPR
performance, we present a fine-tuned CNN which is optimized for JPEG compressed
data and show that it performs more consistently with the image transformations
detected in extremely compressed JPEG images.
- Abstract(参考訳): 視覚位置認識(英: visual place recognition、vpr)とは、視覚刺激を内蔵カメラから正しく解釈し、視点、照明、外観の異なる場所に現在位置しているかどうかを判断するロボットプラットフォームの機能である。
JPEGは広く使われている画像圧縮標準であり、画像の明快さを犠牲にして画像のサイズを大幅に削減することができる。
複数のロボットプラットフォームを同時にデプロイするアプリケーションでは、収集したビジュアルデータを各ロボット間でリモート送信する必要がある。
したがって、JPEG圧縮を用いることで、VPRの帯域幅が限られているため、通信チャネルを介して送信されるデータ量を劇的に削減することができる。
しかし、JPEG圧縮が現在のVPR技術の性能に与える影響は、これまで研究されていない。
そこで本研究では,vpr関連シナリオにおけるjpeg圧縮の詳細な研究を行う。
各種圧縮を施した8つのデータセットに対して,確立されたVPR手法を選択する。
圧縮を導入することにより、特に高い圧縮スペクトルにおいて、VPR性能が大幅に低下することを示す。
JPEG圧縮がVPR性能に与える影響を克服するために,JPEG圧縮データに最適化された微調整CNNを提案する。
関連論文リスト
- Learned Image Compression for HE-stained Histopathological Images via Stain Deconvolution [33.69980388844034]
本稿では,一般的なJPEGアルゴリズムがさらなる圧縮に適していないことを示す。
Stain Quantized Latent Compression, a novel DL based histopathology data compression approach。
提案手法はJPEGのような従来の手法と比較して,下流タスクの分類において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2024-06-18T13:47:17Z) - PatchSVD: A Non-uniform SVD-based Image Compression Algorithm [20.856903918492154]
そこで本研究では,Singular Value Decomposition (SVD) アルゴリズムに基づいて,PatchSVDと呼ばれる領域ベースの損失画像圧縮手法を提案する。
PatchSVDは,3つの画像圧縮指標に対して,SVDに基づく画像圧縮よりも優れることを示す。
論文 参考訳(メタデータ) (2024-06-07T17:57:40Z) - Are Visual Recognition Models Robust to Image Compression? [23.280147529096908]
画像圧縮が視覚認知タスクに与える影響を解析する。
我々は、0.1ビットから2ビット/ピクセル(bpp)までの幅広い圧縮レベルについて検討する。
これら3つのタスクすべてにおいて,強い圧縮を使用する場合,認識能力に大きな影響があることが判明した。
論文 参考訳(メタデータ) (2023-04-10T11:30:11Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Data-Efficient Sequence-Based Visual Place Recognition with Highly
Compressed JPEG Images [17.847661026367767]
視覚的場所認識(VPR)は、ロボットプラットフォームが環境中をローカライズすることを可能にする基本的なタスクである。
JPEGは画像圧縮標準であり、VPRアプリケーションの低データ伝送を容易にするために高い圧縮比を使用することができる。
高レベルのJPEG圧縮を適用すると、画像の明度とサイズが大幅に削減される。
論文 参考訳(メタデータ) (2023-02-26T13:13:51Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Towards Robust Data Hiding Against (JPEG) Compression: A
Pseudo-Differentiable Deep Learning Approach [78.05383266222285]
これらの圧縮に対抗できるデータ隠蔽の目標を達成することは、依然としてオープンな課題である。
ディープラーニングはデータの隠蔽に大きな成功を収めていますが、JPEGの非差別化性は、損失のある圧縮に対する堅牢性を改善するための深いパイプラインのトレーニングを困難にしています。
本稿では,上記の制約をすべて一度に解決するための,単純かつ効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-12-30T12:30:09Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。