論文の概要: Point Cloud-Assisted Neural Image Compression
- arxiv url: http://arxiv.org/abs/2412.11771v1
- Date: Mon, 16 Dec 2024 13:44:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 15:50:00.40367
- Title: Point Cloud-Assisted Neural Image Compression
- Title(参考訳): 点雲支援ニューラルイメージ圧縮
- Authors: Ziqun Li, Qi Zhang, Xiaofeng Huang, Zhao Wang, Siwei Ma, Wei Yan,
- Abstract要約: 本稿では,点雲の助けを借りて画像圧縮性能を向上させる。
画像テクスチャと構造を保存するための点雲支援ニューラルネットワーク(PCA-NIC)を提案する。
私たちの研究は、ポイントクラウドを用いて画像圧縮性能を初めて改善し、最先端のパフォーマンスを実現しました。
- 参考スコア(独自算出の注目度): 35.46346027449056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-efficient image compression is a critical requirement. In several scenarios where multiple modalities of data are captured by different sensors, the auxiliary information from other modalities are not fully leveraged by existing image-only codecs, leading to suboptimal compression efficiency. In this paper, we increase image compression performance with the assistance of point cloud, which is widely adopted in the area of autonomous driving. We first unify the data representation for both modalities to facilitate data processing. Then, we propose the point cloud-assisted neural image codec (PCA-NIC) to enhance the preservation of image texture and structure by utilizing the high-dimensional point cloud information. We further introduce a multi-modal feature fusion transform module (MMFFT) to capture more representative image features, remove redundant information between channels and modalities that are not relevant to the image content. Our work is the first to improve image compression performance using point cloud and achieves state-of-the-art performance.
- Abstract(参考訳): 高効率画像圧縮は必須条件である。
複数のデータモダリティが異なるセンサーによってキャプチャされるいくつかのシナリオでは、他のモダリティからの補助情報は既存の画像のみのコーデックによって完全に活用されないため、最適下圧縮効率が向上する。
本稿では、自律運転の分野で広く採用されている点雲の助けを借りて、画像圧縮性能を向上させる。
まず、両モードのデータ表現を統一し、データ処理を容易にする。
そこで我々は,高次元の点雲情報を利用して,画像テクスチャと構造の保存性を高めるために,点雲支援型ニューラルイメージコーデック(PCA-NIC)を提案する。
さらに,マルチモーダルな特徴融合変換モジュール(MMFFT)を導入し,画像内容に関連のないチャネルとモダリティ間の冗長な情報を除去する。
私たちの研究は、ポイントクラウドを用いて画像圧縮性能を初めて改善し、最先端のパフォーマンスを実現しました。
関連論文リスト
- Plug-and-Play Versatile Compressed Video Enhancement [57.62582951699999]
ビデオ圧縮はファイルのサイズを効果的に削減し、リアルタイムのクラウドコンピューティングを可能にする。
しかし、それは視覚的品質の犠牲となり、下流の視覚モデルの堅牢性に挑戦する。
本稿では,異なる圧縮条件下で動画を適応的に拡張する多言語対応拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-21T18:39:31Z) - Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - Sparse Point Clouds Assisted Learned Image Compression [22.991782666573933]
自律運転シナリオにおける学習画像圧縮を支援するために,スパースポイントクラウドを用いた新しいフレームワークを提案する。
提案手法は,様々な主流画像圧縮モデルと互換性があり,既存の画像圧縮手法を用いてそのアプローチを検証する。
論文 参考訳(メタデータ) (2024-12-20T10:14:12Z) - Stable Diffusion is a Natural Cross-Modal Decoder for Layered AI-generated Image Compression [7.643300240138419]
我々は、複数の人間-理解可能なモダリティを組み込んだスケーラブルなクロスモーダル圧縮フレームワークを導入する。
我々のフレームワークは,高レベルなセマンティック情報を提供するセマンティック層からなる層状ビットストリームに画像をエンコードする。
提案手法は意味的および視覚的詳細の両方を巧みに復元し,極端に低速度でベースラインアプローチと競合する。
論文 参考訳(メタデータ) (2024-12-17T15:01:35Z) - Rendering-Oriented 3D Point Cloud Attribute Compression using Sparse Tensor-based Transformer [52.40992954884257]
3D視覚化技術は、私たちがデジタルコンテンツと対話する方法を根本的に変えてきた。
ポイントクラウドの大規模データサイズは、データ圧縮において大きな課題を呈している。
そこで我々はPCACと差別化可能なレンダリングをシームレスに統合するエンドツーエンドのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-12T16:12:51Z) - Att2CPC: Attention-Guided Lossy Attribute Compression of Point Clouds [18.244200436103156]
本稿では, オートエンコーダアーキテクチャを利用して, ポイントクラウド属性を効率よく圧縮する手法を提案する。
実験の結果,YチャネルのBD-PSNRとYUVチャネルの平均改善率は1.15dBと2.13dBであることがわかった。
論文 参考訳(メタデータ) (2024-10-23T12:32:21Z) - 3D Point Cloud Compression with Recurrent Neural Network and Image
Compression Methods [0.0]
多くのAVアプリケーションでは、LiDARポイントクラウドデータの保存と送信が不可欠である。
データの幅と秩序のない構造のため、ポイントクラウドデータを低ボリュームに圧縮することは困難である。
圧縮アルゴリズムが空間相関を効率的に活用できる新しい3D-to-2D変換を提案する。
論文 参考訳(メタデータ) (2024-02-18T19:08:19Z) - Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文 参考訳(メタデータ) (2023-11-23T08:31:11Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - A Unified Image Preprocessing Framework For Image Compression [5.813935823171752]
そこで我々は,既存のコーデックの性能向上を図るために,Kuchenと呼ばれる統合された画像圧縮前処理フレームワークを提案する。
このフレームワークは、ハイブリッドデータラベリングシステムと、パーソナライズされた前処理をシミュレートする学習ベースのバックボーンで構成されている。
その結果,我々の統合前処理フレームワークによって最適化された現代のコーデックは,常に最先端圧縮の効率を向上することを示した。
論文 参考訳(メタデータ) (2022-08-15T10:41:00Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Variable Rate Compression for Raw 3D Point Clouds [5.107705550575662]
そこで本研究では,生の3Dポイントクラウドデータを用いた新しい可変レート深部圧縮アーキテクチャを提案する。
我々のネットワークは、ポイントクラウドを明示的に処理し、圧縮された記述を生成することができる。
論文 参考訳(メタデータ) (2022-02-28T15:15:39Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Enhanced Invertible Encoding for Learned Image Compression [40.21904131503064]
本稿では,改良されたインバーチブルを提案する。
非可逆ニューラルネットワーク(INN)によるネットワークは、情報損失問題を大幅に軽減し、圧縮性を向上する。
Kodak, CLIC, Tecnick のデータセットによる実験結果から,本手法は既存の学習画像圧縮法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-08T17:32:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。