論文の概要: Sparse Point Clouds Assisted Learned Image Compression
- arxiv url: http://arxiv.org/abs/2412.15752v1
- Date: Fri, 20 Dec 2024 10:14:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 16:22:56.928691
- Title: Sparse Point Clouds Assisted Learned Image Compression
- Title(参考訳): 学習画像圧縮を支援するスパースポイント雲
- Authors: Yiheng Jiang, Haotian Zhang, Li Li, Dong Liu, Zhu Li,
- Abstract要約: 自律運転シナリオにおける学習画像圧縮を支援するために,スパースポイントクラウドを用いた新しいフレームワークを提案する。
提案手法は,様々な主流画像圧縮モデルと互換性があり,既存の画像圧縮手法を用いてそのアプローチを検証する。
- 参考スコア(独自算出の注目度): 22.991782666573933
- License:
- Abstract: In the field of autonomous driving, a variety of sensor data types exist, each representing different modalities of the same scene. Therefore, it is feasible to utilize data from other sensors to facilitate image compression. However, few techniques have explored the potential benefits of utilizing inter-modality correlations to enhance the image compression performance. In this paper, motivated by the recent success of learned image compression, we propose a new framework that uses sparse point clouds to assist in learned image compression in the autonomous driving scenario. We first project the 3D sparse point cloud onto a 2D plane, resulting in a sparse depth map. Utilizing this depth map, we proceed to predict camera images. Subsequently, we use these predicted images to extract multi-scale structural features. These features are then incorporated into learned image compression pipeline as additional information to improve the compression performance. Our proposed framework is compatible with various mainstream learned image compression models, and we validate our approach using different existing image compression methods. The experimental results show that incorporating point cloud assistance into the compression pipeline consistently enhances the performance.
- Abstract(参考訳): 自律運転の分野では、さまざまなセンサーデータタイプが存在し、それぞれが同じシーンの異なるモードを表す。
したがって、画像圧縮を容易にするために、他のセンサのデータを利用することが可能である。
しかし、画像圧縮性能を高めるためにモダリティ間相関を利用する可能性を探る手法はほとんどない。
本稿では,近年の学習画像圧縮の成功を契機に,学習画像圧縮を支援するためにスパースポイントクラウドを用いた新しいフレームワークを提案する。
まず3次元のスパース点雲を2次元平面に投影し、スパース深度マップを作成する。
この深度マップを用いて,カメラ画像の予測を行う。
その後、これらの予測画像を用いて、マルチスケールな構造特徴を抽出する。
これらの機能は、圧縮性能を改善するための追加情報として、学習した画像圧縮パイプラインに組み込まれる。
提案手法は,様々な主流画像圧縮モデルと互換性があり,既存の画像圧縮手法を用いてそのアプローチを検証する。
実験の結果、圧縮パイプラインにポイントクラウドアシストを組み込むことで、継続的に性能が向上することが示された。
関連論文リスト
- Learning-Based Image Compression for Machines [3.678615604632945]
近年、画像の圧縮は後部座席に置かれており、その上に機械学習に基づく分析を行う際の画像の有用性に焦点が移っている。
このような特徴をイメージから取り入れた圧縮パイプラインの需要はこれまでになく高まっている。
本稿では,事前訓練された圧縮符号化パイプラインの様々な部分を微調整し,拡張する様々な手法を提案する。
論文 参考訳(メタデータ) (2024-09-27T23:47:02Z) - 3D Point Cloud Compression with Recurrent Neural Network and Image
Compression Methods [0.0]
多くのAVアプリケーションでは、LiDARポイントクラウドデータの保存と送信が不可欠である。
データの幅と秩序のない構造のため、ポイントクラウドデータを低ボリュームに圧縮することは困難である。
圧縮アルゴリズムが空間相関を効率的に活用できる新しい3D-to-2D変換を提案する。
論文 参考訳(メタデータ) (2024-02-18T19:08:19Z) - Deep learning based Image Compression for Microscopy Images: An
Empirical Study [3.915183869199319]
本研究では,古典的および深層学習に基づく画像圧縮法とその深層学習に基づく画像処理モデルへの影響について分析する。
このような所望の方法で画像を圧縮するには、複数の古典的損失画像圧縮技術と、複数のAIベースの圧縮モデルを比較する。
その結果、AIベースの圧縮技術は従来の圧縮技術よりも優れており、2Dケースでは下流のラベルなしタスクに最小限の影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2023-11-02T16:00:32Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Optimizing Image Compression via Joint Learning with Denoising [49.83680496296047]
スマートフォンカメラに搭載された比較的小さなセンサーのため、今日の撮像画像には高レベルのノイズが通常存在している。
計算コストを少なくして目的をシンプルかつ効果的に実現できるように,プラグイン機能付き2分岐重み共有アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-07-22T04:23:01Z) - RIDDLE: Lidar Data Compression with Range Image Deep Delta Encoding [21.70770383279559]
ライダーは、自律運転や拡張現実に広く使われている深度測定センサーである。
ライダーが生成する大量のデータは、データストレージと送信のコストが高くなる可能性がある。
RIDDLE (Range Image Deep DeLta) と呼ばれる新しいデータ駆動レンジ画像圧縮アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-02T21:53:43Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - Enhanced Invertible Encoding for Learned Image Compression [40.21904131503064]
本稿では,改良されたインバーチブルを提案する。
非可逆ニューラルネットワーク(INN)によるネットワークは、情報損失問題を大幅に軽減し、圧縮性を向上する。
Kodak, CLIC, Tecnick のデータセットによる実験結果から,本手法は既存の学習画像圧縮法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-08T17:32:10Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。