Fugu-MT 論文翻訳(概要): Image compression optimized for 3D reconstruction by utilizing deep neural networks

論文の概要: Image compression optimized for 3D reconstruction by utilizing deep neural networks

arxiv url: http://arxiv.org/abs/2003.12618v2
Date: Sat, 24 Jul 2021 17:18:35 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-19 04:53:29.593237
Title: Image compression optimized for 3D reconstruction by utilizing deep neural networks
Title（参考訳）: ディープニューラルネットワークを用いた3次元再構成のための画像圧縮
Authors: Alex Golts and Yoav Y. Schechner
Abstract要約: 両課題を協調的に解決する統合ネットワークアーキテクチャを提案する。提案したモデルにより圧縮された画像はJPEG 2000圧縮に比べて3次元再構成性能が優れている。
参考スコア（独自算出の注目度）: 13.960152426268763
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Computer vision tasks are often expected to be executed on compressed images. Classical image compression standards like JPEG 2000 are widely used. However, they do not account for the specific end-task at hand. Motivated by works on recurrent neural network (RNN)-based image compression and three-dimensional (3D) reconstruction, we propose unified network architectures to solve both tasks jointly. These joint models provide image compression tailored for the specific task of 3D reconstruction. Images compressed by our proposed models, yield 3D reconstruction performance superior as compared to using JPEG 2000 compression. Our models significantly extend the range of compression rates for which 3D reconstruction is possible. We also show that this can be done highly efficiently at almost no additional cost to obtain compression on top of the computation already required for performing the 3D reconstruction task.
Abstract（参考訳）: コンピュータビジョンタスクは、しばしば圧縮された画像上で実行される。 JPEG 2000のような古典的な画像圧縮標準は広く使われている。しかし、それらは手元にある特定のエンドタスクを説明できない。リカレントニューラルネットワーク(RNN)に基づく画像圧縮と3次元再構成の研究により、両課題を協調的に解決する統合ネットワークアーキテクチャを提案する。これらのジョイントモデルは、3D再構成の特定のタスクに適した画像圧縮を提供する。提案モデルにより圧縮された画像はJPEG 2000圧縮に比べて3次元再構成性能が優れている。本モデルは3次元再構成が可能な圧縮速度の範囲を大幅に拡張する。また, 3次元復元作業を行うのに必要な計算量の上に圧縮を得るには, ほぼ何の費用もかからず, 高い効率で実現できることを示す。

関連論文リスト

TinySplat: Feedforward Approach for Generating Compact 3D Scene Representation [38.50388562890992]
TinySplatは、コンパクトな3Dシーン表現を生成するための完全なフィードフォワードアプローチである。 TinySplatは標準フィードフォワード3DGS法に基づいており、トレーニング不要の圧縮フレームワークを統合している。私たちのフレームワークはエンコーディング時間の25%とデコーディング時間の1%しか必要としません。
論文参考訳（メタデータ） (2025-06-11T07:47:19Z)
Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization [14.71160140310766]
3D Gaussian Splatting (3DGS) は3次元再構成において顕著な効果を示し, 実時間放射場レンダリングによる高品質な結果を得た。単一のシーンを再構築するには、通常、59の浮動小数点パラメータで表現された数百万のガウススプラットが必要で、約1GBのメモリが生成される。具体的には、ノイズ置換ベクトル量子化手法を用いて、コードブックとモデルの特徴を共同でトレーニングし、降下勾配最適化とパラメータ離散化の整合性を確保する。
論文参考訳（メタデータ） (2025-04-03T22:19:34Z)
Fast Feedforward 3D Gaussian Splatting Compression [55.149325473447384]
3D Gaussian Splatting (FCGS) は、1つのフィードフォワードパスで3DGS表現を高速に圧縮できる最適化フリーモデルである。 FCGSは圧縮比を20倍以上に向上し、高精細度を維持しながら、ほとんどのシーン毎のSOTA最適化手法を上回ります。
論文参考訳（メタデータ） (2024-10-10T15:13:08Z)
The Effect of Lossy Compression on 3D Medical Images Segmentation with Deep Learning [39.97900702763419]
我々は、20倍の圧縮損失がディープニューラルネットワーク(DNN)によるセグメンテーション品質に悪影響を及ぼさないことを示した。さらに、圧縮データに基づいて訓練されたDNNモデルを用いて、圧縮されていないデータを予測する能力を示す。
論文参考訳（メタデータ） (2024-09-25T08:31:37Z)
Lossless Image Compression Using Multi-level Dictionaries: Binary Images [2.2940141855172036]
画像の保存や伝送コストを削減するために、さまざまなアプリケーションにおいてロスレス画像圧縮が必要である。カラー画像の圧縮性は、本質的には空間構造におけるパターンから導かれるものであると論じる。提案手法はまず,バイナリ画像のデータセットから16時間16ドル,8時間8ドル,4時間4ドル,2時間2平方ピクセルパターンの辞書を学習する。
論文参考訳（メタデータ） (2024-06-05T09:24:10Z)
Attention-Based Generative Neural Image Compression on Solar Dynamics Observatory [12.283978726972752]
NASAのSolar Dynamics Observatory(SDO)ミッションは、地球同期軌道から毎日1.4テラバイトのデータを収集する。近年、画像圧縮を行う上で、エンドツーエンド最適化された人工知能(ANN)が大きな可能性を示している。我々は、宇宙ミッションで格納・回収されるデータ量を削減するために、アドホックなANNベースの画像圧縮スキームを設計した。
論文参考訳（メタデータ） (2022-10-12T17:39:08Z)
Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文参考訳（メタデータ） (2021-12-08T13:02:53Z)
Lossy Medical Image Compression using Residual Learning-based Dual Autoencoder Model [12.762298148425794]
本稿では,2段階のオートエンコーダをベースとした,マラリアRBC細胞イメージパッチの圧縮のための圧縮機・圧縮機フレームワークを提案する。提案した残差ベースデュアルオートエンコーダネットワークは、元の画像の再構成に使用されるユニークな特徴を抽出するために訓練される。このアルゴリズムは、JPEG-LS、JP2K-LM、CALIC、最近のニューラルネットワークアプローチよりも76%、78%、75%、および74%のビット節約率で大幅に改善されている。
論文参考訳（メタデータ） (2021-08-24T08:38:58Z)
Variable-Rate Deep Image Compression through Spatially-Adaptive Feature Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文参考訳（メタデータ） (2021-08-21T17:30:06Z)
A New Backbone for Hyperspectral Image Reconstruction [90.48427561874402]
3次元ハイパースペクトル画像(HSI)再構成は、スナップショット圧縮画像の逆過程を指す。空間/スペクトル不変Residual U-Net、すなわちSSI-ResU-Netを提案する。 SSI-ResU-Net は浮動小数点演算の 77.3% 以上で競合する性能を実現する。
論文参考訳（メタデータ） (2021-08-17T16:20:51Z)
Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文参考訳（メタデータ） (2020-04-17T00:10:08Z)
Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文参考訳（メタデータ） (2020-03-23T11:21:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。