論文の概要: Land-then-transport: A Flow Matching-Based Generative Decoder for Wireless Image Transmission
- arxiv url: http://arxiv.org/abs/2601.07512v1
- Date: Mon, 12 Jan 2026 13:09:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.395847
- Title: Land-then-transport: A Flow Matching-Based Generative Decoder for Wireless Image Transmission
- Title(参考訳): Land-then-transport: 無線画像伝送のためのフローマッチングに基づく生成デコーダ
- Authors: Jingwen Fu, Ming Xiao, Mikael Skoglund, Dong In Kim,
- Abstract要約: 低遅延デコーディングのためのフローマッチング生成デコーダを提案する。
JPEG2000+LDPC、DeepJSCC、拡散ベースラインに対して一貫した利得を示す実験がある。
LTTは、無線画像デコード生成のための決定論的、物理的に解釈可能、効率的なフレームワークを提供する。
- 参考スコア(独自算出の注目度): 38.71668959954467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to strict rate and reliability demands, wireless image transmission remains difficult for both classical layered designs and joint source-channel coding (JSCC), especially under low latency. Diffusion-based generative decoders can deliver strong perceptual quality by leveraging learned image priors, but iterative stochastic denoising leads to high decoding delay. To enable low-latency decoding, we propose a flow-matching (FM) generative decoder under a new land-then-transport (LTT) paradigm that tightly integrates the physical wireless channel into a continuous-time probability flow. For AWGN channels, we build a Gaussian smoothing path whose noise schedule indexes effective noise levels, and derive a closed-form teacher velocity field along this path. A neural-network student vector field is trained by conditional flow matching, yielding a deterministic, channel-aware ODE decoder with complexity linear in the number of ODE steps. At inference, it only needs an estimate of the effective noise variance to set the ODE starting time. We further show that Rayleigh fading and MIMO channels can be mapped, via linear MMSE equalization and singular-value-domain processing, to AWGN-equivalent channels with calibrated starting times. Therefore, the same probability path and trained velocity field can be reused for Rayleigh and MIMO without retraining. Experiments on MNIST, Fashion-MNIST, and DIV2K over AWGN, Rayleigh, and MIMO demonstrate consistent gains over JPEG2000+LDPC, DeepJSCC, and diffusion-based baselines, while achieving good perceptual quality with only a few ODE steps. Overall, LTT provides a deterministic, physically interpretable, and computation-efficient framework for generative wireless image decoding across diverse channels.
- Abstract(参考訳): 厳密な速度と信頼性の要求のため、無線画像伝送は古典的な層設計とジョイントソースチャネル符号化(JSCC)の両方において、特に低レイテンシ下では困難である。
拡散に基づく生成デコーダは、学習した画像の先行値を活用することで、強い知覚品質を提供することができるが、反復的確率的復号化は、高い復号遅延をもたらす。
低遅延復号化を実現するために,物理無線チャネルを連続時間確率流に密に統合する新しいランド・then-transport(LTT)パラダイムの下で,フローマッチング(FM)生成復号器を提案する。
AWGNチャネルに対して、ノイズスケジュールが有効な雑音レベルを指標としたガウススムースメントパスを構築し、この経路に沿って閉形式の教師速度場を導出する。
ニューラルネットワークの学生ベクトル場は条件付きフローマッチングによって訓練され、ODEステップ数で複雑に線形な決定論的チャネル対応ODEデコーダが得られる。
推測では、ODE開始時刻を設定するのに有効なノイズ分散を見積もるだけでよい。
さらに、線形MMSE等化処理と特異値領域処理により、レイリーフェーディングとMIMOチャネルを調整開始時間付きAWGN等価チャネルにマッピング可能であることを示す。
そのため、Rayleigh と MIMO は再トレーニングなしに、同じ確率パスとトレーニングされた速度場を再利用することができる。
AWGN、Rayleigh、MIMOによるMNIST、Fashion-MNIST、DIV2Kの実験では、JPEG2000+LDPC、DeepJSCC、拡散ベースラインよりも一貫した向上を示した。
全体として、LTTは、様々なチャネルにまたがる生成無線画像デコードのための決定論的、物理的に解釈可能、計算効率の高いフレームワークを提供する。
関連論文リスト
- Consistency Flow Model Achieves One-step Denoising Error Correction Codes [28.89866643527586]
高忠実度ワンステップ復号のための誤り補正整合流れモデル(ECCFM)を提案する。
ECCFMは自己回帰や拡散に基づくベースラインよりもビットエラー率(BER)が低い。
拡散デコーダよりも30倍から100倍高速な推論速度を提供する。
論文 参考訳(メタデータ) (2025-12-01T08:07:51Z) - Unsupervised Radio Map Construction in Mixed LoS/NLoS Indoor Environments [34.91945910235526]
本稿では,チャネル伝播シーケンスから直接データ収集軌道を復元することを目的とする。
提案手法は,室内環境における平均局部位置精度0.65mを実現する。
論文 参考訳(メタデータ) (2025-10-09T09:53:24Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Channelformer: Attention based Neural Solution for Wireless Channel
Estimation and Effective Online Training [1.0499453838486013]
本稿では,改良されたチャネル推定を実現するために,エンコーダ・デコーダニューラルアーキテクチャ(Channelformer)を提案する。
我々は,復号器として,エンコーダと残差畳み込みニューラルアーキテクチャに多面的注意を払っている。
また,現代通信システムにおける第5世代(5G)新しい無線(NR)構成に基づく効果的なオンライントレーニング手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T23:18:23Z) - Non-Coherent Over-the-Air Decentralized Gradient Descent [0.0]
無線システムにおける分散グラディエントDescentの実装は、ノイズ、フェーディング、帯域幅の制限により困難である。
本稿では,スケジューリング,トポロジ情報,CSIの必要性を解消するスケーラブルなDGDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-19T19:15:34Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z) - Two-Timescale End-to-End Learning for Channel Acquisition and Hybrid
Precoding [94.40747235081466]
本研究では,ミリ波(mmWave)大規模マルチインプット多重出力(MIMO)システムのためのエンドツーエンドの深層学習に基づくジョイントトランスシーバ設計アルゴリズムを提案する。
我々は受信したパイロットを受信機でフィードバックビットにマッピングし、さらに送信機でハイブリッドプリコーダにフィードバックビットをマッピングするDNNアーキテクチャを開発した。
論文 参考訳(メタデータ) (2021-10-22T20:49:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。