論文の概要: L3C-Stereo: Lossless Compression for Stereo Images
- arxiv url: http://arxiv.org/abs/2108.09422v1
- Date: Sat, 21 Aug 2021 02:36:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-25 09:40:25.451574
- Title: L3C-Stereo: Lossless Compression for Stereo Images
- Title(参考訳): L3C-Stereo:ステレオ画像のロスレス圧縮
- Authors: Zihao Huang, Zhe Sun, Feng Duan, Andrzej Cichocki, Peiying Ruan and
Chao Li
- Abstract要約: 多くの自律運転タスクは高解像度ステレオ画像を必要とし、大量のストレージスペースを必要とする。
そこで本研究では,2つの主モジュールからなるマルチスケールロスレス圧縮モデルであるL3C-Stereoを提案する。
実験では,手作り圧縮法と学習ベース法を3つのデータセットで比較した。
- 参考スコア(独自算出の注目度): 24.6995551743392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A large number of autonomous driving tasks need high-definition stereo
images, which requires a large amount of storage space. Efficiently executing
lossless compression has become a practical problem. Commonly, it is hard to
make accurate probability estimates for each pixel. To tackle this, we propose
L3C-Stereo, a multi-scale lossless compression model consisting of two main
modules: the warping module and the probability estimation module. The warping
module takes advantage of two view feature maps from the same domain to
generate a disparity map, which is used to reconstruct the right view so as to
improve the confidence of the probability estimate of the right view. The
probability estimation module provides pixel-wise logistic mixture
distributions for adaptive arithmetic coding. In the experiments, our method
outperforms the hand-crafted compression methods and the learning-based method
on all three datasets used. Then, we show that a better maximum disparity can
lead to a better compression effect. Furthermore, thanks to a compression
property of our model, it naturally generates a disparity map of an acceptable
quality for the subsequent stereo tasks.
- Abstract(参考訳): 多数の自動運転タスクには高精細なステレオ画像が必要であり、大量のストレージスペースを必要とする。
効率よく無損失圧縮を実行することが現実的な問題となっている。
一般に、各画素の正確な確率推定を行うのは難しい。
そこで本稿では, ワープモジュールと確率推定モジュールの2つの主要モジュールからなるマルチスケールロスレス圧縮モデルであるL3C-Stereoを提案する。
ワープモジュールは、同じドメインからの2つのビュー特徴写像を利用して、適切なビューを再構成し、正しいビューの確率推定の信頼性を向上させるために使用される不均一マップを生成する。
確率推定モジュールは、適応算術符号化のための画素単位のロジスティック混合分布を提供する。
実験では,3つのデータセットすべてにおいて,手作り圧縮法と学習ベース法を上回った。
そして, 最大偏差が圧縮効果を向上させることを示す。
さらに,本モデルの圧縮特性により,後続のステレオタスクに対して許容される品質の差マップを自然に生成する。
関連論文リスト
- PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion [80.79938369319152]
我々は,PCF(Probabilis-tic Contrastive Fusion)に基づくPCF-Liftという新しいパイプラインを設計する。
私たちのPCFリフトは、ScanNetデータセットやMessy Roomデータセット(シーンレベルのPQが4.4%改善)など、広く使用されているベンチマークにおいて、最先端の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-10-14T16:06:59Z) - Variable-Rate Learned Image Compression with Multi-Objective
Optimization and Quantization-Reconstruction Offsets [8.670873561640903]
本論文は,すべての潜伏テンソル要素の均一な量子化を行うために,単一量子化ステップサイズを変化させる従来のアプローチに従う。
可変レート圧縮性能を改善するために3つの改良が提案されている。
得られた可変レート圧縮結果から,複数のモデルのトレーニングと比較すると,圧縮性能の低下は無視できるか最小かのどちらかを示す。
論文 参考訳(メタデータ) (2024-02-29T07:45:02Z) - Generative Multiplane Neural Radiance for 3D-Aware Image Generation [102.15322193381617]
本稿では,複数のターゲットビューに対して連続した3次元高解像度画像を効率よく生成する手法を提案する。
我々のGMNRモデルは、単一のV100上で17.6FPSの1024×1024ピクセルの3D認識画像を生成する。
論文 参考訳(メタデータ) (2023-04-03T17:41:20Z) - Selective compression learning of latent representations for
variable-rate image compression [38.077284943341105]
本稿では、ディープラーニングに基づく可変レート画像圧縮のための、潜在表現を部分的に完全に一般化した方法で符号化する選択的圧縮法を提案する。
提案手法は、個別に訓練された参照圧縮モデルと同等の圧縮効率を達成でき、選択圧縮による復号時間を削減することができる。
論文 参考訳(メタデータ) (2022-11-08T09:09:59Z) - Curvature-guided dynamic scale networks for Multi-view Stereo [10.667165962654996]
本稿では,重み計算を伴わずにマッチングコストの性能を向上させるために,ロバストな特徴抽出ネットワークを学習することに焦点を当てる。
動的スケール特徴抽出ネットワーク,すなわちCDSFNetを提案する。
複数の新しい畳み込み層で構成され、それぞれが画像表面の通常の曲率でガイドされる各画素に対して適切なパッチスケールを選択することができる。
論文 参考訳(メタデータ) (2021-12-11T14:41:05Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Learning Scalable $\ell_\infty$-constrained Near-lossless Image
Compression via Joint Lossy Image and Residual Compression [118.89112502350177]
本稿では,$ell_infty$-constrained near-lossless image compressionを学習するための新しいフレームワークを提案する。
元の残差の学習確率モデルを定量化し、量子化残差の確率モデルを導出する。
論文 参考訳(メタデータ) (2021-03-31T11:53:36Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Training with Quantization Noise for Extreme Model Compression [57.51832088938618]
与えられたモデルサイズに対する精度を最大化しながら、コンパクトなモデルを作成するという問題に取り組む。
標準的な解決策は、トレーニング中に重みが定量化され、勾配がストレート・スルー推定器に近似される量子化意識訓練(Quantization Aware Training)でネットワークをトレーニングすることである。
本稿では, この手法を, 極端な圧縮法を用いて, int8 の固定点量子化を超えて機能するように拡張する。
論文 参考訳(メタデータ) (2020-04-15T20:10:53Z) - Compressed Volumetric Heatmaps for Multi-Person 3D Pose Estimation [33.71628590745982]
単眼RGB画像からボトムアップな3次元人物ポーズ推定手法を提案する。
本稿では,この表現のサイズを大幅に削減する,シンプルで効率的な圧縮手法を提案する。
提案手法は,多人・一対一の3次元ポーズ推定データセットを用いた場合と比較して,好適に機能する。
論文 参考訳(メタデータ) (2020-04-01T10:37:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。