論文の概要: Data-Efficient Sequence-Based Visual Place Recognition with Highly
Compressed JPEG Images
- arxiv url: http://arxiv.org/abs/2302.13314v1
- Date: Sun, 26 Feb 2023 13:13:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 17:44:07.025302
- Title: Data-Efficient Sequence-Based Visual Place Recognition with Highly
Compressed JPEG Images
- Title(参考訳): 高圧縮JPEG画像を用いたデータ効率の良いシーケンスベース視覚位置認識
- Authors: Mihnea-Alexandru Tomita, Bruno Ferrarini, Michael Milford, Klaus
McDonald-Maier, Shoaib Ehsan
- Abstract要約: 視覚的場所認識(VPR)は、ロボットプラットフォームが環境中をローカライズすることを可能にする基本的なタスクである。
JPEGは画像圧縮標準であり、VPRアプリケーションの低データ伝送を容易にするために高い圧縮比を使用することができる。
高レベルのJPEG圧縮を適用すると、画像の明度とサイズが大幅に削減される。
- 参考スコア(独自算出の注目度): 17.847661026367767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Place Recognition (VPR) is a fundamental task that allows a robotic
platform to successfully localise itself in the environment. For decentralised
VPR applications where the visual data has to be transmitted between several
agents, the communication channel may restrict the localisation process when
limited bandwidth is available. JPEG is an image compression standard that can
employ high compression ratios to facilitate lower data transmission for VPR
applications. However, when applying high levels of JPEG compression, both the
image clarity and size are drastically reduced. In this paper, we incorporate
sequence-based filtering in a number of well-established, learnt and non-learnt
VPR techniques to overcome the performance loss resulted from introducing high
levels of JPEG compression. The sequence length that enables 100% place
matching performance is reported and an analysis of the amount of data required
for each VPR technique to perform the transfer on the entire spectrum of JPEG
compression is provided. Moreover, the time required by each VPR technique to
perform place matching is investigated, on both uniformly and non-uniformly
JPEG compressed data. The results show that it is beneficial to use a highly
compressed JPEG dataset with an increased sequence length, as similar levels of
VPR performance are reported at a significantly reduced bandwidth. The results
presented in this paper also emphasize that there is a trade-off between the
amount of data transferred and the total time required to perform VPR. Our
experiments also suggest that is often favourable to compress the query images
to the same quality of the map, as more efficient place matching can be
performed. The experiments are conducted on several VPR datasets, under mild to
extreme JPEG compression.
- Abstract(参考訳): 視覚的場所認識(VPR)は、ロボットプラットフォームが環境中をローカライズすることを可能にする基本的なタスクである。
複数のエージェント間で視覚データを送信しなければならない分散VPRアプリケーションの場合、通信チャネルは帯域幅が限られている場合のローカライズプロセスを制限できる。
JPEGは画像圧縮標準であり、VPRアプリケーションの低データ伝送を容易にするために高い圧縮比を使用することができる。
しかし、高レベルのJPEG圧縮を適用すると、画像の明度とサイズが大幅に削減される。
本稿では,JPEG圧縮の高レベル化による性能低下を克服するために,シーケンスベースフィルタリングを多数の確立された学習型,非学習型VPR技術に取り入れる。
位置マッチング性能100%を実現するシーケンス長を報告し、jpeg圧縮のスペクトル全体の転送を行うために各vpr技術に必要なデータ量の解析を行う。
さらに,一様かつ一様でないJPEG圧縮データに対して,各VPR技術による位置マッチングに必要な時間について検討した。
その結果、VPR性能の類似レベルが帯域幅を著しく小さくするので、シーケンス長が大きくなる高度に圧縮されたJPEGデータセットを使用することは有益であることがわかった。
また,本論文では,転送データ量とVPRの実行に必要な合計時間との間にはトレードオフがあることも強調した。
我々の実験は、より効率的な位置マッチングを行うことができるため、クエリ画像を同じ品質の地図に圧縮することが好ましいこともしばしば示唆している。
実験は、軽度から極端なJPEG圧縮の下で、いくつかのVPRデータセットで実施される。
関連論文リスト
- ODDN: Addressing Unpaired Data Challenges in Open-World Deepfake Detection on Online Social Networks [51.03118447290247]
オープンワールドデータアグリゲーション(ODA)と圧縮・ディスカード勾配補正(CGC)を組み合わせたオープンワールドディープフェイク検出ネットワーク(ODDN)を提案する。
細粒度分析と粗粒度分析の両方により,ODAは圧縮試料と原試料の相関関係を効果的に集約する。
CGCは、オンラインソーシャルネットワーク(OSN)における多種多様な圧縮方法のパフォーマンス向上のために、圧縮・ディスカード勾配補正を組み込んだ。
論文 参考訳(メタデータ) (2024-10-24T12:32:22Z) - Learned Image Compression for HE-stained Histopathological Images via Stain Deconvolution [33.69980388844034]
本稿では,一般的なJPEGアルゴリズムがさらなる圧縮に適していないことを示す。
Stain Quantized Latent Compression, a novel DL based histopathology data compression approach。
提案手法はJPEGのような従来の手法と比較して,下流タスクの分類において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2024-06-18T13:47:17Z) - PatchSVD: A Non-uniform SVD-based Image Compression Algorithm [20.856903918492154]
そこで本研究では,Singular Value Decomposition (SVD) アルゴリズムに基づいて,PatchSVDと呼ばれる領域ベースの損失画像圧縮手法を提案する。
PatchSVDは,3つの画像圧縮指標に対して,SVDに基づく画像圧縮よりも優れることを示す。
論文 参考訳(メタデータ) (2024-06-07T17:57:40Z) - UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - Hyperspectral Image Compression Using Sampling and Implicit Neural
Representations [2.3931689873603603]
ハイパースペクトル画像は、シーンの画像中の画素の電磁スペクトルを記録する。
これらの画像の撮影コストが低下する中で、ハイパースペクトル画像の保存、送信、解析のための効率的な技術を開発する必要がある。
本稿では,暗黙的ニューラル表現を用いたハイパースペクトル画像圧縮法を提案する。
論文 参考訳(メタデータ) (2023-12-04T01:10:04Z) - Learned Lossless Compression for JPEG via Frequency-Domain Prediction [50.20577108662153]
JPEG画像のロスレス圧縮を学習するための新しいフレームワークを提案する。
周波数領域での学習を可能にするために、DCT係数は暗黙の局所冗長性を利用するためにグループに分割される。
グループ化されたDCT係数のエントロピーモデリングを実現するために、重み付きブロックに基づいてオートエンコーダのようなアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-03-05T13:15:28Z) - Data Efficient Visual Place Recognition Using Extremely JPEG-Compressed
Images [17.847661026367767]
本稿では,JPEG圧縮が視覚的位置認識技術の性能に与える影響について検討する。
圧縮を導入することにより、特に高い圧縮スペクトルにおいて、VPR性能が大幅に低下することを示す。
我々は、JPEG圧縮データに最適化された微調整CNNを提案し、非常に圧縮されたJPEG画像で検出された画像変換とより一貫した性能を示す。
論文 参考訳(メタデータ) (2022-09-17T14:46:28Z) - Perceptual Quality Assessment for Fine-Grained Compressed Images [38.615746092795625]
そこで本研究では,精細レベルの圧縮画像に対するフル参照画像品質評価(FR-IQA)手法を提案する。
提案手法は,FGIQAデータベース上での圧縮画像品質評価(FGIQA)により検証される。
論文 参考訳(メタデータ) (2022-06-08T12:56:45Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。