論文の概要: A Novel Framework to Jointly Compress and Index Remote Sensing Images
for Efficient Content-Based Retrieval
- arxiv url: http://arxiv.org/abs/2201.06459v1
- Date: Mon, 17 Jan 2022 15:13:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-20 09:35:27.301110
- Title: A Novel Framework to Jointly Compress and Index Remote Sensing Images
for Efficient Content-Based Retrieval
- Title(参考訳): 効率的なコンテンツベース検索のためのリモートセンシング画像の圧縮とインデックス化のための新しいフレームワーク
- Authors: Jun Xiang, Gencer Sumbul, Nimisha Thekke Madam, Beg\"um Demir
- Abstract要約: リモートセンシング(RS)画像は通常圧縮形式で保存され、アーカイブの保存サイズが小さくなる。
既存のコンテンツベースの画像検索システムは、CBIRを適用する前にデコード画像を必要とする。
本稿では,RS画像の圧縮とインデックス化を同時に学習するジョイントフレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.291910356217187
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote sensing (RS) images are usually stored in compressed format to reduce
the storage size of the archives. Thus, existing content-based image retrieval
(CBIR) systems in RS require decoding images before applying CBIR (which is
computationally demanding in the case of large-scale CBIR problems). To address
this problem, in this paper, we present a joint framework that simultaneously
learns RS image compression and indexing, eliminating the need for decoding RS
images before applying CBIR. The proposed framework is made up of two modules.
The first module aims at effectively compressing RS images. It is achieved
based on an auto-encoder architecture. The second module aims at producing hash
codes with a high discrimination capability. It is achieved based on a deep
hashing method that exploits soft pairwise, bit-balancing and classification
loss functions. We also propose a two stage learning strategy with gradient
manipulation techniques to obtain image representations that are compatible
with both RS image indexing and compression. Experimental results show the
compression and CBIR efficacy of the proposed framework when compared to widely
used approaches in RS. The code of the proposed framework is available at
https://git.tu-berlin.de/rsim/RS-JCIF.
- Abstract(参考訳): リモートセンシング(rs)イメージは通常、アーカイブのストレージサイズを減らすために圧縮フォーマットに保存される。
したがって、RSの既存のコンテンツベース画像検索(CBIR)システムは、CBIRを適用する前にデコード画像を必要とする(大規模なCBIR問題の場合、計算的に要求される)。
そこで本稿では,CBIR適用前のRS画像の復号化を不要とし,RS画像の圧縮とインデックス化を同時に学習するジョイントフレームワークを提案する。
提案するフレームワークは2つのモジュールで構成されている。
最初のモジュールはRS画像を効果的に圧縮することを目的としている。
自動エンコーダアーキテクチャに基づいて実現される。
第2のモジュールは、高い差別能力を備えたハッシュコードの生成を目標としている。
ソフトペア、ビットバランス、分類損失関数を利用するディープハッシュ法に基づいて実現されている。
また,rs画像インデクシングと圧縮の両方に適合する画像表現を得るために,勾配操作技術を用いた2段階学習戦略を提案する。
実験の結果,提案フレームワークの圧縮とCBIRの有効性がRSで広く用いられている手法と比較された。
提案されたフレームワークのコードはhttps://git.tu-berlin.de/rsim/RS-JCIFで公開されている。
関連論文リスト
- MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large
Multimodal Model [81.35367970135778]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - Sentence-level Prompts Benefit Composed Image Retrieval [69.78119883060006]
合成画像検索(CIR)は、参照画像と相対キャプションの両方を含むクエリを用いて、特定の画像を検索するタスクである。
本稿では,事前訓練されたV-Lモデル,例えばBLIP-2を用いて文レベルのプロンプトを生成することを提案する。
提案手法は,Fashion-IQおよびCIRRデータセット上の最先端のCIR手法に対して良好に動作する。
論文 参考訳(メタデータ) (2023-10-09T07:31:44Z) - CompaCT: Fractal-Based Heuristic Pixel Segmentation for Lossless
Compression of High-Color DICOM Medical Images [0.0]
医用画像は、医師による正確な分析のために、ピクセル単位の12ビットの高色深度を必要とする。
フィルタリングによる画像の標準圧縮はよく知られているが、具体化されていない実装のため、医療領域ではまだ最適ではない。
本研究では,動的に拡張されたデータ処理のための画素濃度の空間的特徴とパターンをターゲットとした医用画像圧縮アルゴリズムCompaCTを提案する。
論文 参考訳(メタデータ) (2023-08-24T21:43:04Z) - Rapid-INR: Storage Efficient CPU-free DNN Training Using Implicit Neural
Representation [8.236360727616127]
Implicit Neural Representation (INR) は、複雑な形状や物体を、その形状や表面構造を明確に定義せずに表現するための革新的なアプローチである。
従来の研究では、画像圧縮のINRとしてニューラルネットワークを使用することの有効性が実証されており、JPEGのような従来の手法に匹敵する性能を示している。
本稿では、画像のエンコーディングと圧縮にINRを利用する新しいアプローチであるRapid-INRを紹介し、コンピュータビジョンタスクにおけるニューラルネットワークトレーニングを高速化する。
論文 参考訳(メタデータ) (2023-06-29T05:49:07Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Raw Image Reconstruction with Learned Compact Metadata [61.62454853089346]
本稿では,メタデータとしての潜在空間におけるコンパクトな表現をエンドツーエンドで学習するための新しいフレームワークを提案する。
提案する生画像圧縮方式は,グローバルな視点から重要な画像領域に適応的により多くのビットを割り当てることができることを示す。
論文 参考訳(メタデータ) (2023-02-25T05:29:45Z) - Asymmetric Learned Image Compression with Multi-Scale Residual Block,
Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。
多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。
そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T09:34:29Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Lossy Medical Image Compression using Residual Learning-based Dual
Autoencoder Model [12.762298148425794]
本稿では,2段階のオートエンコーダをベースとした,マラリアRBC細胞イメージパッチの圧縮のための圧縮機・圧縮機フレームワークを提案する。
提案した残差ベースデュアルオートエンコーダネットワークは、元の画像の再構成に使用されるユニークな特徴を抽出するために訓練される。
このアルゴリズムは、JPEG-LS、JP2K-LM、CALIC、最近のニューラルネットワークアプローチよりも76%、78%、75%、および74%のビット節約率で大幅に改善されている。
論文 参考訳(メタデータ) (2021-08-24T08:38:58Z) - MBRS : Enhancing Robustness of DNN-based Watermarking by Mini-Batch of
Real and Simulated JPEG Compression [40.944632292011846]
JPEGのロバスト性を高めるために,Mini-Batch of Real and Simulated JPEG compression (MBRS) を用いた新しいエンドツーエンドトレーニングアーキテクチャを提案する。
我々のモデルは抽出されたメッセージに対して0.01%未満のビット誤り率を達成し、符号化された画像に対してPSNRが36以上であり、JPEG攻撃に対する堅牢性を示す。
論文 参考訳(メタデータ) (2021-08-18T15:47:37Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。