論文の概要: TreeNet: A Light Weight Model for Low Bitrate Image Compression
- arxiv url: http://arxiv.org/abs/2512.16743v1
- Date: Thu, 18 Dec 2025 16:40:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.164184
- Title: TreeNet: A Light Weight Model for Low Bitrate Image Compression
- Title(参考訳): TreeNet:低ビットレート画像圧縮のための軽量モデル
- Authors: Mahadev Prasad Panda, Purnachandra Rao Makkena, Srivatsa Prativadibhayankaram, Siegfried Fößel, André Kaup,
- Abstract要約: TreeNetは、バイナリツリー構造化エンコーダデコーダアーキテクチャを利用して効率的な表現と再構成を実現する、新しい低複雑さ画像圧縮モデルである。
広く使用されている3つのベンチマークデータセット上でTreeNetを評価し、JPEG AIを含む競合する手法と比較した。
最低でも、TreeNetはJPEG AIよりも平均4.83%のBDレート向上を実現し、モデルの複雑さを87.82%削減した。
- 参考スコア(独自算出の注目度): 16.673721698938646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reducing computational complexity remains a critical challenge for the widespread adoption of learning-based image compression techniques. In this work, we propose TreeNet, a novel low-complexity image compression model that leverages a binary tree-structured encoder-decoder architecture to achieve efficient representation and reconstruction. We employ attentional feature fusion mechanism to effectively integrate features from multiple branches. We evaluate TreeNet on three widely used benchmark datasets and compare its performance against competing methods including JPEG AI, a recent standard in learning-based image compression. At low bitrates, TreeNet achieves an average improvement of 4.83% in BD-rate over JPEG AI, while reducing model complexity by 87.82%. Furthermore, we conduct extensive ablation studies to investigate the influence of various latent representations within TreeNet, offering deeper insights into the factors contributing to reconstruction.
- Abstract(参考訳): 計算複雑性の低減は、学習ベースの画像圧縮技術の普及にとって重要な課題である。
本研究では,2進木構造エンコーダ・デコーダアーキテクチャを利用して効率的な表現と再構成を実現する,新しい低複雑さ画像圧縮モデルであるTreeNetを提案する。
複数の枝の特徴を効果的に統合するために,注目機能融合機構を用いる。
我々は、広く使用されている3つのベンチマークデータセット上でTreeNetを評価し、その性能を、最近の学習ベース画像圧縮の標準であるJPEG AIを含む競合する手法と比較した。
低ビットレートでは、TreeNetはJPEG AIよりも平均4.83%のBDレート向上を実現し、モデルの複雑さを87.82%削減した。
さらに,ツリーネット内の様々な潜伏表現の影響について,広範囲にわたるアブレーション研究を行い,再建に寄与する要因についてより深い知見を提供する。
関連論文リスト
- Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - Pathology Image Compression with Pre-trained Autoencoders [52.208181380986524]
デジタル病理学における全スライド画像は、記憶、伝達、計算効率の面で大きな課題をもたらす。
JPEGのような標準的な圧縮手法はファイルサイズを小さくするが、下流のタスクに不可欠な微細な表現型の詳細を保存できない。
本研究では,遅延拡散モデル用に設計されたオートエンコーダ(AE)を,病理画像の効率的な学習圧縮フレームワークとして再利用する。
論文 参考訳(メタデータ) (2025-03-14T17:01:17Z) - Tree-NET: Enhancing Medical Image Segmentation Through Efficient Low-Level Feature Training [0.0]
本稿では,医療画像セグメンテーションのための新しいフレームワークであるTree-NETを紹介する。
Tree-NETは、セグメンテーション精度と計算効率の両方を向上させるためにボトルネック機能監視を使用する。
実験の結果、Tree-NETはFLOPを4倍から13倍に減らし、メモリ使用量を減らし、元のものと同等または優れた精度を実現していることがわかった。
論文 参考訳(メタデータ) (2025-01-03T23:17:01Z) - Extreme Image Compression using Fine-tuned VQGANs [43.43014096929809]
本稿ではベクトル量子化(VQ)に基づく生成モデルを画像圧縮領域に導入する。
VQGANモデルによって学習されたコードブックは、強い表現能力をもたらす。
提案したフレームワークは、知覚的品質指向のメトリクスで最先端のコーデックより優れている。
論文 参考訳(メタデータ) (2023-07-17T06:14:19Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Lossless Compression with Latent Variable Models [4.289574109162585]
我々は「非対称数値系を持つビットバック」(bb-ans)と呼ぶ潜在変数モデルを用いる。
この方法は、エンコードおよびデコードステップをインターリーブし、データのバッチ圧縮時に最適なレートを達成する。
我々は,深層生成モデルを用いた圧縮の高速プロトタイピングのために開発したモジュール型ソフトウェアフレームワークである'craystack'について述べる。
論文 参考訳(メタデータ) (2021-04-21T14:03:05Z) - Efficient CNN-LSTM based Image Captioning using Neural Network
Compression [0.0]
CNN-LSTMベースの画像キャプションモデルの非従来のエンドツーエンド圧縮パイプラインを紹介します。
次に、異なる圧縮アーキテクチャがモデルに与える影響を検討し、73.1%のモデルサイズ削減を実現する圧縮アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-12-17T16:25:09Z) - Learning Better Lossless Compression Using Lossy Compression [100.50156325096611]
我々は、ロスレス画像圧縮システムを構築するために、強力なロスレス画像圧縮アルゴリズムであるBPGを利用する。
我々は,BPG再構成を条件とした畳み込みニューラルネットワークに基づく確率モデルを用いて,残差分布をモデル化する。
そして、この画像は、BPGが生成したビットストリームと学習した残留コーダの連結を用いて保存される。
論文 参考訳(メタデータ) (2020-03-23T11:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。