論文の概要: The Rate-Distortion-Perception-Classification Tradeoff: Joint Source Coding and Modulation via Inverse-Domain GANs
- arxiv url: http://arxiv.org/abs/2312.14792v2
- Date: Thu, 6 Jun 2024 10:52:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-08 00:10:18.252361
- Title: The Rate-Distortion-Perception-Classification Tradeoff: Joint Source Coding and Modulation via Inverse-Domain GANs
- Title(参考訳): 速度-歪み-知覚-知覚-分類トレードオフ:逆領域GANによる結合音源符号化と変調
- Authors: Junli Fang, João F. C. Mota, Baoshan Lu, Weicheng Zhang, Xuemin Hong,
- Abstract要約: チャネルレート,歪み知覚,分類精度の厳密なトレードオフが存在することを示す。
本稿では,このトレードオフをナビゲートする2つの画像圧縮手法を提案する。
また、提案したID-GANアルゴリズムは、画像の歪み、知覚、分類精度のバランスを保ち、従来の分離法よりも大幅に優れていることを示した。
- 参考スコア(独自算出の注目度): 4.735670734773145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The joint source-channel coding (JSCC) framework leverages deep learning to learn from data the best codes for source and channel coding. When the output signal, rather than being binary, is directly mapped onto the IQ domain (complex-valued), we call the resulting framework joint source coding and modulation (JSCM). We consider a JSCM scenario and show the existence of a strict tradeoff between channel rate, distortion, perception, and classification accuracy, a tradeoff that we name RDPC. We then propose two image compression methods to navigate that tradeoff: the RDPCO algorithm which, under simple assumptions, directly solves the optimization problem characterizing the tradeoff, and an algorithm based on an inverse-domain generative adversarial network (ID-GAN), which is more general and achieves extreme compression. Simulation results corroborate the theoretical findings, showing that both algorithms exhibit the RDPC tradeoff. They also demonstrate that the proposed ID-GAN algorithm effectively balances image distortion, perception, and classification accuracy, and significantly outperforms traditional separation-based methods and recent deep JSCM architectures in terms of one or more of these metrics.
- Abstract(参考訳): ジョイントソースチャネルコーディング(JSCC)フレームワークは、ディープラーニングを活用して、ソースとチャネルのコーディングに最適なコードから学習する。
出力信号がバイナリではなく、IQドメインに直接マップされると(複素値)、結果のフレームワークをJSCM(Joint Source coding and modulation)と呼ぶ。
JSCMのシナリオを考察し、RDPCと呼ばれるチャネルレート、歪み、知覚、分類精度の厳密なトレードオフの存在を示す。
次に、このトレードオフをナビゲートする2つの画像圧縮手法を提案する。単純な仮定の下で、トレードオフを特徴付ける最適化問題を直接解決するRDPCOアルゴリズムと、より汎用的で極端な圧縮を実現する逆ドメイン生成対向ネットワーク(ID-GAN)に基づくアルゴリズムである。
シミュレーションの結果は理論的な結果と相関し、両方のアルゴリズムがRDPCのトレードオフを示すことを示した。
また,提案したID-GANアルゴリズムは画像の歪み,知覚,分類精度のバランスを効果的に保ち,従来の分離手法や最近の深部JSCMアーキテクチャを1つ以上の指標で著しく上回っていることを示した。
関連論文リスト
- Deep Joint Source-Channel Coding with Iterative Source Error Correction [11.41076729592696]
深層学習に基づくジョイントソースチャネル符号(Deep J SCC)に対する反復的ソース誤り訂正(ISEC)復号法を提案する。
チャネルを通じて受信されたノイズワードに対して、Deep J SCCエンコーダとデコーダペアを使用して、コードを反復的に更新する。
提案手法は, チャネルノイズ特性がトレーニング時に使用するものと一致しない場合に, ベースラインよりも信頼性の高いソース再構成結果を生成する。
論文 参考訳(メタデータ) (2023-02-17T22:50:58Z) - Generative Joint Source-Channel Coding for Semantic Image Transmission [29.738666406095074]
ディープニューラルネットワーク(DNN)を用いたJSCCスキームは、無線画像伝送において有望な結果をもたらす。
本稿では,無線画像伝送における深部生成モデル(DGM)の知覚品質を活用する2つの新しいJ SCC方式を提案する。
論文 参考訳(メタデータ) (2022-11-24T19:14:27Z) - Exploiting Temporal Structures of Cyclostationary Signals for
Data-Driven Single-Channel Source Separation [98.95383921866096]
単一チャネルソース分離(SCSS)の問題点について検討する。
我々は、様々なアプリケーション領域に特に適するサイクロ定常信号に焦点を当てる。
本稿では,最小MSE推定器と競合するU-Netアーキテクチャを用いたディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T14:04:56Z) - Magic ELF: Image Deraining Meets Association Learning and Transformer [63.761812092934576]
本稿では,CNN と Transformer を統合化して,画像デライニングにおける学習のメリットを活用することを目的とする。
降雨除去と背景復旧を関連づける新しいマルチインプット・アテンション・モジュール (MAM) を提案する。
提案手法(ELF)は,最先端手法(MPRNet)を平均0.25dB向上させる。
論文 参考訳(メタデータ) (2022-07-21T12:50:54Z) - Perceptual Learned Source-Channel Coding for High-Fidelity Image
Semantic Transmission [7.692038874196345]
本稿では, 深部JSCCの最適化のために, 対向損失を導入する。
我々の新しい深層JSCCアーキテクチャは、エンコーダ、無線チャネル、デコーダ/ジェネレータ、および識別器を組み合わせたものである。
ユーザスタディでは、知覚的に類似したエンドツーエンドの画像伝送品質を達成することで、約50%の無線チャネル帯域幅コストを節約できることを確認した。
論文 参考訳(メタデータ) (2022-05-26T03:05:13Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - LoRD-Net: Unfolded Deep Detection Network with Low-Resolution Receivers [104.01415343139901]
本稿では,1ビット計測から情報シンボルを復元する「LoRD-Net」というディープ検出器を提案する。
LoRD-Netは、関心のシグナルを回復するためのタスクベースのアーキテクチャである。
無線通信における1ビット信号回復のためのレシーバアーキテクチャの評価を行った。
論文 参考訳(メタデータ) (2021-02-05T04:26:05Z) - Phase Retrieval using Expectation Consistent Signal Recovery Algorithm
based on Hypernetwork [73.94896986868146]
位相検索は現代の計算イメージングシステムにおいて重要な要素である。
近年のディープラーニングの進歩は、堅牢で高速なPRの新たな可能性を開いた。
我々は、既存の制限を克服するために、深層展開のための新しいフレームワークを開発する。
論文 参考訳(メタデータ) (2021-01-12T08:36:23Z) - Bandwidth-Agile Image Transmission with Deep Joint Source-Channel Coding [7.081604594416339]
画像が時間や頻度で徐々に層に伝達されるシナリオを考察する。
DeepJSCC-$l$は、畳み込みオートエンコーダを使用する革新的なソリューションである。
DeepJSCC-$l$は、低信号対雑音比(SNR)と小さな帯域幅規則の挑戦において、最先端のデジタルプログレッシブ伝送方式と同等の性能を持つ。
論文 参考訳(メタデータ) (2020-09-26T00:11:50Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Infomax Neural Joint Source-Channel Coding via Adversarial Bit Flip [41.28049430114734]
本稿では、ニューラルジョイント・ソース・チャネル符号化方式の安定性と堅牢性を改善するために、Infomax Adversarial-Bit-Flip (IABF) と呼ばれる新しい正規化手法を提案する。
我々のIABFは、圧縮と誤り訂正のベンチマークの両方で最先端のパフォーマンスを達成でき、ベースラインをかなりの差で上回ることができる。
論文 参考訳(メタデータ) (2020-04-03T10:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。