論文の概要: Image compression optimized for 3D reconstruction by utilizing deep
neural networks
- arxiv url: http://arxiv.org/abs/2003.12618v2
- Date: Sat, 24 Jul 2021 17:18:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 04:53:29.593237
- Title: Image compression optimized for 3D reconstruction by utilizing deep
neural networks
- Title(参考訳): ディープニューラルネットワークを用いた3次元再構成のための画像圧縮
- Authors: Alex Golts and Yoav Y. Schechner
- Abstract要約: 両課題を協調的に解決する統合ネットワークアーキテクチャを提案する。
提案したモデルにより圧縮された画像はJPEG 2000圧縮に比べて3次元再構成性能が優れている。
- 参考スコア(独自算出の注目度): 13.960152426268763
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Computer vision tasks are often expected to be executed on compressed images.
Classical image compression standards like JPEG 2000 are widely used. However,
they do not account for the specific end-task at hand. Motivated by works on
recurrent neural network (RNN)-based image compression and three-dimensional
(3D) reconstruction, we propose unified network architectures to solve both
tasks jointly. These joint models provide image compression tailored for the
specific task of 3D reconstruction. Images compressed by our proposed models,
yield 3D reconstruction performance superior as compared to using JPEG 2000
compression. Our models significantly extend the range of compression rates for
which 3D reconstruction is possible. We also show that this can be done highly
efficiently at almost no additional cost to obtain compression on top of the
computation already required for performing the 3D reconstruction task.
- Abstract(参考訳): コンピュータビジョンタスクは、しばしば圧縮された画像上で実行される。
JPEG 2000のような古典的な画像圧縮標準は広く使われている。
しかし、それらは手元にある特定のエンドタスクを説明できない。
リカレントニューラルネットワーク(RNN)に基づく画像圧縮と3次元再構成の研究により、両課題を協調的に解決する統合ネットワークアーキテクチャを提案する。
これらのジョイントモデルは、3D再構成の特定のタスクに適した画像圧縮を提供する。
提案モデルにより圧縮された画像はJPEG 2000圧縮に比べて3次元再構成性能が優れている。
本モデルは3次元再構成が可能な圧縮速度の範囲を大幅に拡張する。
また, 3次元復元作業を行うのに必要な計算量の上に圧縮を得るには, ほぼ何の費用もかからず, 高い効率で実現できることを示す。
関連論文リスト
- Attention-Based Generative Neural Image Compression on Solar Dynamics
Observatory [12.283978726972752]
NASAのSolar Dynamics Observatory(SDO)ミッションは、地球同期軌道から毎日1.4テラバイトのデータを収集する。
近年、画像圧縮を行う上で、エンドツーエンド最適化された人工知能(ANN)が大きな可能性を示している。
我々は、宇宙ミッションで格納・回収されるデータ量を削減するために、アドホックなANNベースの画像圧縮スキームを設計した。
論文 参考訳(メタデータ) (2022-10-12T17:39:08Z) - Convolutional Neural Network (CNN) to reduce construction loss in JPEG
compression caused by Discrete Fourier Transform (DFT) [0.0]
畳み込みニューラルネットワーク(CNN)は他の多くのディープニューラルネットワークよりも注目されている。
本研究では,オートエンコーダを用いた効率的な画像圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-08-26T12:46:16Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - IVS3D: An Open Source Framework for Intelligent Video Sampling and
Preprocessing to Facilitate 3D Reconstruction [0.8029049649310211]
iVS3Dは、画像シーケンスのインテリジェントな前処理のためのフレームワークである。
われわれのソフトウェアは、ビデオ全体を特定のフレームレートにダウンできる。
モジュールアーキテクチャのおかげで、追加のアルゴリズムでプラグインを開発し、統合するのは簡単です。
論文 参考訳(メタデータ) (2021-10-22T14:31:04Z) - Lossy Medical Image Compression using Residual Learning-based Dual
Autoencoder Model [12.762298148425794]
本稿では,2段階のオートエンコーダをベースとした,マラリアRBC細胞イメージパッチの圧縮のための圧縮機・圧縮機フレームワークを提案する。
提案した残差ベースデュアルオートエンコーダネットワークは、元の画像の再構成に使用されるユニークな特徴を抽出するために訓練される。
このアルゴリズムは、JPEG-LS、JP2K-LM、CALIC、最近のニューラルネットワークアプローチよりも76%、78%、75%、および74%のビット節約率で大幅に改善されている。
論文 参考訳(メタデータ) (2021-08-24T08:38:58Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - A New Backbone for Hyperspectral Image Reconstruction [90.48427561874402]
3次元ハイパースペクトル画像(HSI)再構成は、スナップショット圧縮画像の逆過程を指す。
空間/スペクトル不変Residual U-Net、すなわちSSI-ResU-Netを提案する。
SSI-ResU-Net は浮動小数点演算の 77.3% 以上で競合する性能を実現する。
論文 参考訳(メタデータ) (2021-08-17T16:20:51Z) - Efficient CNN-LSTM based Image Captioning using Neural Network
Compression [0.0]
CNN-LSTMベースの画像キャプションモデルの非従来のエンドツーエンド圧縮パイプラインを紹介します。
次に、異なる圧縮アーキテクチャがモデルに与える影響を検討し、73.1%のモデルサイズ削減を実現する圧縮アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-12-17T16:25:09Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。