論文の概要: Transformations in Learned Image Compression from a Communication
Perspective
- arxiv url: http://arxiv.org/abs/2203.02158v1
- Date: Fri, 4 Mar 2022 07:07:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-07 21:03:51.805655
- Title: Transformations in Learned Image Compression from a Communication
Perspective
- Title(参考訳): コミュニケーションの観点からの学習画像圧縮における変換
- Authors: Youneng Bao, Fangyang Meng, Wen Tan, Chao Li, Yonghong Tian and
Yongsheng Liang
- Abstract要約: licの量子化は、加法的一様雑音を持つ一般化されたチャネルと見なされる。
通信システムの技術は、モジュールの設計をlicでガイドするために応用できる。
信号変調(TSM)に基づく統一変換法を定義する。
- 参考スコア(独自算出の注目度): 21.64734759275193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, a unified transformation method in learned image
compression(LIC) is proposed from the perspective of communication. Firstly,
the quantization in LIC is considered as a generalized channel with additive
uniform noise. Moreover, the LIC is interpreted as a particular communication
system according to the consistency in structures and optimization objectives.
Thus, the technology of communication systems can be applied to guide the
design of modules in LIC. Furthermore, a unified transform method based on
signal modulation (TSM) is defined. In the view of TSM, the existing
transformation methods are mathematically reduced to a linear modulation. A
series of transformation methods, e.g. TPM and TJM, are obtained by extending
to nonlinear modulation. The experimental results on various datasets and
backbone architectures verify that the effectiveness and robustness of the
proposed method. More importantly, it further confirms the feasibility of
guiding LIC design from a communication perspective. For example, when backbone
architecture is hyperprior combining context model, our method achieves
3.52$\%$ BD-rate reduction over GDN on Kodak dataset without increasing
complexity.
- Abstract(参考訳): 本稿では,コミュニケーションの観点から,学習画像圧縮(lic)における統一変換法を提案する。
第一に、licの量子化は加法的一様雑音を持つ一般化されたチャネルと見なされる。
さらに、構造と最適化目的の一貫性に応じて、licを特定の通信システムとして解釈する。
したがって、通信システムの技術は、モジュールの設計をlicでガイドするために応用できる。
さらに、信号変調(TSM)に基づく統一変換法を定義する。
tsmの観点からは、既存の変換法は線形変調に数学的に還元される。
TPMやTJMといった一連の変換法は、非線形変調に拡張することで得られる。
各種データセットおよびバックボーンアーキテクチャの実験結果から,提案手法の有効性とロバスト性を検証した。
さらに重要なことは、コミュニケーションの観点からlic設計を導く可能性をさらに確認することである。
例えば、バックボーンアーキテクチャがハイパープリオ結合コンテキストモデルである場合、複雑さを増すことなく、kodakデータセット上のgdnよりも3.52$\%$ bdレートの削減を達成します。
関連論文リスト
- Unleashing Network Potentials for Semantic Scene Completion [50.95486458217653]
本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。
AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。
AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2024-03-12T11:48:49Z) - Images in Discrete Choice Modeling: Addressing Data Isomorphism in
Multi-Modality Inputs [77.54052164713394]
本稿では,離散選択モデリング(DCM)と機械学習の交わりについて考察する。
本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。
論文 参考訳(メタデータ) (2023-12-22T14:33:54Z) - Learning Modulated Transformation in GANs [69.95217723100413]
生成逆数ネットワーク(GAN)のジェネレータに、変調変換モジュール(Modulated transformation module, MTM)と呼ばれるプラグアンドプレイモジュールを装備する。
MTMは、可変位置で畳み込み操作を適用可能な潜在符号の制御下で空間オフセットを予測する。
挑戦的なTaiChiデータセット上での人為的な生成に向けて、StyleGAN3のFIDを21.36から13.60に改善し、変調幾何変換の学習の有効性を実証した。
論文 参考訳(メタデータ) (2023-08-29T17:51:22Z) - Dynamic Kernel-Based Adaptive Spatial Aggregation for Learned Image
Compression [63.56922682378755]
本稿では,空間アグリゲーション機能の拡張に焦点をあて,動的カーネルベースの変換符号化を提案する。
提案したアダプティブアグリゲーションはカーネルオフセットを生成し、コンテント条件付き範囲の有効な情報をキャプチャして変換を支援する。
実験により,本手法は,最先端の学習手法と比較して,3つのベンチマークにおいて高い速度歪み性能が得られることを示した。
論文 参考訳(メタデータ) (2023-08-17T01:34:51Z) - A Unifying Multi-sampling-ratio CS-MRI Framework With Two-grid-cycle
Correction and Geometric Prior Distillation [7.643154460109723]
本稿では,モデルベースと深層学習に基づく手法の利点を融合して,深層展開型マルチサンプリング比CS-MRIフレームワークを提案する。
マルチグリッドアルゴリズムにインスパイアされ、まずCS-MRIに基づく最適化アルゴリズムを補正蒸留方式に組み込む。
各段の圧縮サンプリング比から適応的なステップ長と雑音レベルを学習するために条件モジュールを用いる。
論文 参考訳(メタデータ) (2022-05-14T13:36:27Z) - SUMD: Super U-shaped Matrix Decomposition Convolutional neural network
for Image denoising [0.0]
ネットワークに行列分解モジュール(MD)を導入し,グローバルなコンテキスト機能を確立する。
U字型アーキテクチャの多段階的プログレッシブ復元の設計に触発されて,MDモジュールをマルチブランチに統合する。
我々のモデル(SUMD)は、Transformerベースの手法で、同等の視覚的品質と精度が得られる。
論文 参考訳(メタデータ) (2022-04-11T04:38:34Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Regularity Learning via Explicit Distribution Modeling for Skeletal
Video Anomaly Detection [43.004613173363566]
確率的視点からポーズ動作表現を提供するために,新しい動き埋め込み (ME) を提案する。
タスク固有の空間時間変換器(STT)を自己教師型ポーズシーケンス再構築のために配置する。
MoPRLは、いくつかの挑戦的なデータセットに対して平均4.7%のAUCの改善によって最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-12-07T11:52:25Z) - Online Meta Adaptation for Variable-Rate Learned Image Compression [40.8361915315201]
この研究は、ディープニューラルネットワークに基づくエンドツーエンドの学習画像圧縮(lic)の2つの大きな問題に対処する。
我々は,条件付き変分自動エンコーダフレームワークにおけるメタラーニングとオンラインラーニングのアイデアを組み合わせた,licのオンラインメタラーニング(OML)設定を導入する。
論文 参考訳(メタデータ) (2021-11-16T06:46:23Z) - Analogous to Evolutionary Algorithm: Designing a Unified Sequence Model [58.17021225930069]
実演的進化アルゴリズム(EA)と類似した視覚変換器の合理性について説明する。
我々は、より効率的なEATモデルを提案し、様々なタスクに柔軟に対処するタスク関連ヘッドを設計する。
近年のビジョントランスに比べて,イメージネット分類作業における最先端の成果が得られている。
論文 参考訳(メタデータ) (2021-05-31T16:20:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。