Fugu-MT 論文翻訳(概要): Adapting Diffusion Language Models for Lossless Pixel-Level Image Transmission

論文の概要: Adapting Diffusion Language Models for Lossless Pixel-Level Image Transmission

arxiv url: http://arxiv.org/abs/2606.06273v1
Date: Thu, 04 Jun 2026 15:14:31 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-05 22:39:44.892135
Title: Adapting Diffusion Language Models for Lossless Pixel-Level Image Transmission
Title（参考訳）: ロスレス画素レベル画像伝送のための拡散言語モデルの適用
Authors: Tianqi Ren, Rongpeng Li, Xianfu Chen, Yingyu Li, Zhifeng Zhao,
Abstract要約: ロスレスピクセルレベルの画像伝送は、セマンティック通信以上の基本的な仕組みである。本稿では,画像伝送のための個別なシンボル拡散モデルに基づくソースチャネル符号化フレームワークを提案する。
参考スコア（独自算出の注目度）: 13.755711145996592
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Lossless pixel-level image transmission is a fundamental regime beyond semantic communications, because exact recovery requires both accurate symbol probability modeling and reliable delivery over noisy channels. This paper proposes DDM-SSCC, a discrete-diffusion-model-based separate source-channel coding framework for lossless image transmission. Different from raster-order autoregressive coding, the proposed source codec adapts a diffusion language model to pixel-token restoration and performs synchronized reverse arithmetic coding under bidirectional attention, allowing multiple masked tokens to be coded within one reverse denoising step. This progressive restoration process also yields a more favorable source representation for noisy transmission, since newly restored tokens can serve as bidirectional context in subsequent denoising steps. To bridge the gap between generation-oriented masked denoising and lossless arithmetic coding, we further introduce a Halton-guided denoising order, a mask-ratio-aware cosine schedule, and a lightweight temperature calibration module. These designs respectively improve spatial coverage, adapt the denoising pace to context reliability, and calibrate the probability tables used by arithmetic coding. Experiments on CIFAR10, DIV2K-LR-X4, and Kodak over additive white Gaussian noise and Rayleigh fading channels show that DDM-SSCC achieves better exact-recovery performance than representative lossless and semantic communication baselines, while ablation studies verify the effectiveness of the proposed denoising order, schedule, and calibration modules.
Abstract（参考訳）: なぜなら、正確なリカバリには正確なシンボル確率モデリングとノイズのあるチャネルによる信頼性のある配信の両方が必要であるからだ。本稿では、ロスレス画像伝送のための離散拡散モデルに基づく個別ソースチャネル符号化フレームワークであるDDM-SSCCを提案する。ラスタ次自己回帰符号と異なり、提案したソースコードコーデックは拡散言語モデルを画素token復元に適用し、双方向の注意の下で同期された逆算術符号化を行い、複数のマスク付きトークンを1つの逆復調ステップで符号化することができる。このプログレッシブな復元プロセスは、新たに復元されたトークンがその後のデノナイジングステップにおいて双方向のコンテキストとして機能するため、ノイズ伝達のためのより好ましいソース表現も得られる。世代指向マスマスキングとロスレス算術符号化のギャップを埋めるため,Halton-Guided denoising order,マスク比コサインスケジュール,軽量温度校正モジュールを導入する。これらの設計は、それぞれ空間的カバレッジを改善し、文脈の信頼性に認知のペースを適応させ、算術符号化で使用される確率テーブルを校正する。 CIFAR10, DIV2K-LR-X4, Kodakによる付加的な白色ガウスノイズとレイリーフェディングチャネルによる実験により, DDM-SSCCは, 損失のない, 意味的な通信ベースラインよりも精度の高い精度を達成でき, アブレーション実験では, 提案した復調順序, スケジュール, キャリブレーションモジュールの有効性が検証された。

関連論文リスト

Single-Stage Signal Attenuation Diffusion Model for Low-Light Image Enhancement and Denoising [4.397450561168298]
拡散モデルは、前方雑音付加と逆雑音の確率論的モデリングによる画像復元において優れる。主ストリーム拡散に基づく低光画像強調法 (LLIE) は、U-Net出力を洗練させるために、2段パイプラインまたは補助補正ネットワークを採用する。本稿では,信号減衰機構を拡散パイプラインに統合する新しい拡散過程である信号減衰拡散モデル(SADM)を提案する。
論文参考訳（メタデータ） (2026-04-07T11:33:04Z)
Consistency Flow Model Achieves One-step Denoising Error Correction Codes [28.89866643527586]
高忠実度ワンステップ復号のための誤り補正整合流れモデル(ECCFM)を提案する。 ECCFMは自己回帰や拡散に基づくベースラインよりもビットエラー率(BER)が低い。拡散デコーダよりも30倍から100倍高速な推論速度を提供する。
論文参考訳（メタデータ） (2025-12-01T08:07:51Z)
SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文参考訳（メタデータ） (2025-03-16T12:32:11Z)
Diffusion-Aided Joint Source Channel Coding For High Realism Wireless Image Transmission [24.372996233209854]
DiffJSCCは条件拡散復調法により高現実性画像を生成する新しいフレームワークである。 768x512ピクセルのコダック画像を3072のシンボルで再現できる。
論文参考訳（メタデータ） (2024-04-27T00:12:13Z)
Adaptive Semantic-Enhanced Denoising Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution [7.252121550658619]
Denoising Diffusion Probabilistic Model (DDPM) は画像再構成において有望な性能を示した。 DDPMが生成する高周波の詳細は、モデルが長距離の意味的文脈を見落としているため、HR画像との不一致に悩まされることが多い。 DDPMの詳細な保存能力を高めるために,適応的意味強化DDPM(ASDDPM)を提案する。
論文参考訳（メタデータ） (2024-03-17T04:08:58Z)
Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文参考訳（メタデータ） (2022-09-26T03:28:23Z)
Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文参考訳（メタデータ） (2022-09-16T11:00:50Z)
Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文参考訳（メタデータ） (2022-02-09T18:48:02Z)
Diffusion-Based Representation Learning [65.55681678004038]
教師付き信号のない表現学習を実現するために,デノナイズスコアマッチングフレームワークを拡張した。対照的に、拡散に基づく表現学習は、デノナイジングスコアマッチング目的の新しい定式化に依存している。同じ手法を用いて,半教師付き画像分類における最先端モデルの改善を実現する無限次元潜在符号の学習を提案する。
論文参考訳（メタデータ） (2021-05-29T09:26:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。