論文の概要: Streaming-capable High-performance Architecture of Learned Image
Compression Codecs
- arxiv url: http://arxiv.org/abs/2208.01641v1
- Date: Tue, 2 Aug 2022 03:15:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 14:04:25.431517
- Title: Streaming-capable High-performance Architecture of Learned Image
Compression Codecs
- Title(参考訳): 学習画像圧縮コーデックのストリーミング対応高性能アーキテクチャ
- Authors: Fangzheng Lin, Heming Sun, Jiro Katto
- Abstract要約: 本稿では,様々な学習画像圧縮モデルのランタイム性能向上のための代替手法を提案する。
私たちのアーキテクチャだけでも、ニューラルモデル自体を変更することなく優れたパフォーマンスを実現しています。
私たちの実装は,ベースラインと比較してスループットとレイテンシが優れています。
- 参考スコア(独自算出の注目度): 21.53261818914534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learned image compression allows achieving state-of-the-art accuracy and
compression ratios, but their relatively slow runtime performance limits their
usage. While previous attempts on optimizing learned image codecs focused more
on the neural model and entropy coding, we present an alternative method to
improving the runtime performance of various learned image compression models.
We introduce multi-threaded pipelining and an optimized memory model to enable
GPU and CPU workloads asynchronous execution, fully taking advantage of
computational resources. Our architecture alone already produces excellent
performance without any change to the neural model itself. We also demonstrate
that combining our architecture with previous tweaks to the neural models can
further improve runtime performance. We show that our implementations excel in
throughput and latency compared to the baseline and demonstrate the performance
of our implementations by creating a real-time video streaming encoder-decoder
sample application, with the encoder running on an embedded device.
- Abstract(参考訳): 学習した画像圧縮は、最先端の精度と圧縮比を実現することができるが、実行時のパフォーマンスが比較的遅いため、使用が制限される。
ニューラルネットワークとエントロピー符号化に焦点を絞った学習画像コーデックの最適化の試みでは,様々な学習画像圧縮モデルのランタイム性能を改善するための代替手法を提案する。
マルチスレッドパイプラインと最適化されたメモリモデルを導入し、GPUとCPUの非同期実行を可能にし、計算資源を完全に活用する。
私たちのアーキテクチャだけでも、ニューラルモデル自体を変更することなく、優れたパフォーマンスを実現しています。
また、アーキテクチャとニューラルモデルへの以前の調整を組み合わせることで、実行時のパフォーマンスがさらに向上することを示した。
本実装は,ビデオストリーミングエンコーダ-デコーダサンプルアプリケーションを作成し,エンコーダを組込みデバイス上で動作させることで,ベースラインと比較してスループットとレイテンシに優れており,実装の性能を示す。
関連論文リスト
- Efficient Contextformer: Spatio-Channel Window Attention for Fast
Context Modeling in Learned Image Compression [1.9249287163937978]
学習画像に対する変換器に基づく自己回帰的文脈モデルである、効率的なコンテキストフォーマ(eContextformer)を導入する。
並列コンテキストモデリングのためのパッチワイド、チェッカー、チャンネルワイドのグルーピングテクニックを融合する。
モデル複雑性が145倍、デコード速度が210Cx向上し、Kodak、CLI、Tecnickデータセット上での平均ビット節約を実現している。
論文 参考訳(メタデータ) (2023-06-25T16:29:51Z) - Lossy Image Compression with Quantized Hierarchical VAEs [33.173021636656465]
ResNet VAEはもともとデータ(画像)の分散モデリングのために設計された。
自然画像の損失圧縮における従来の手法より優れる、強力で効率的なモデルを提案する。
本モデルでは,画像を粗大に圧縮し,並列符号化と復号化をサポートする。
論文 参考訳(メタデータ) (2022-08-27T17:15:38Z) - ELIC: Efficient Learned Image Compression with Unevenly Grouped
Space-Channel Contextual Adaptive Coding [9.908820641439368]
本研究では,最先端の速度と圧縮能力を実現するための効率的なモデルであるELICを提案する。
優れたパフォーマンスで、提案モデルは極めて高速なプレビューデコーディングとプログレッシブデコーディングもサポートする。
論文 参考訳(メタデータ) (2022-03-21T11:19:50Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - A Real-time Action Representation with Temporal Encoding and Deep
Compression [115.3739774920845]
動作表現のための時間畳み込み3Dネットワーク(T-C3D)と呼ばれる新しいリアルタイム畳み込みアーキテクチャを提案する。
T-C3Dは、高プロセス速度を得ながら、階層的な多粒度でビデオアクション表現を学習する。
提案手法は,5MB未満のストレージモデルを用いて,提案手法の精度5.4%,推論速度2倍の高速化を実現した。
論文 参考訳(メタデータ) (2020-06-17T06:30:43Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。