論文の概要: Efficient INT8 Single-Image Super-Resolution via Deployment-Aware Quantization and Teacher-Guided Training
- arxiv url: http://arxiv.org/abs/2604.20291v1
- Date: Wed, 22 Apr 2026 07:39:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.021748
- Title: Efficient INT8 Single-Image Super-Resolution via Deployment-Aware Quantization and Teacher-Guided Training
- Title(参考訳): デプロイ対応量子化と教師指導によるシングルイメージ超解像の効率的なINT8
- Authors: Pham Phuong Nam Nguyen, Nam Tien Le, Thi Kim Trang Vo, Nhu Tinh Anh Nguyen,
- Abstract要約: シングルイメージ超解像 (SISR) は、低ビット配置下での再構成忠実度、モデルコンパクト性、ロバストさのバランスをとる必要がある。
本稿では,抽出-精細サンプル設計に基づくデプロイメント指向の量子化SISRフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient single-image super-resolution (SISR) requires balancing reconstruction fidelity, model compactness, and robustness under low-bit deployment, which is especially challenging for x3 SR. We present a deployment-oriented quantized SISR framework based on an extract-refine-upsample design. The student performs most computation in the low-resolution space and uses a lightweight re-parameterizable backbone with PixelShuffle reconstruction, yielding a compact inference graph. To improve quality without significantly increasing complexity, we adopt a three-stage training pipeline: Stage 1 learns a basic reconstruction mapping with spatial supervision; Stage 2 refines fidelity using Charbonnier loss, DCT-domain supervision, and confidence-weighted output-level distillation from a Mamba-based teacher; and Stage 3 applies quantization-aware training directly on the fused deploy graph. We further use weight clipping and BatchNorm recalibration to improve quantization stability. On the MAI 2026 Quantized 4K Image Super-Resolution Challenge test set, our final AIO MAI submission achieves 29.79 dB PSNR and 0.8634 SSIM, obtaining a final score of 1.8 under the target mobile INT8 deployment setting. Ablation on Stage 3 optimization shows that teacher-guided supervision improves the dynamic INT8 TFLite reconstruction from 29.91 dB/0.853 to 30.0003 dB/0.856, while the fixed-shape deployable INT8 TFLite artifact attains 30.006 dB/0.857.
- Abstract(参考訳): 効率のよいシングルイメージ超解像(SISR)は、低ビット配置下での再構成忠実度、モデルコンパクト性、ロバスト性のバランスを必要とするが、これは特にx3 SRでは困難である。
本稿では,抽出-精細サンプル設計に基づくデプロイメント指向の量子化SISRフレームワークを提案する。
学生は低解像度空間でほとんどの計算を行い、PixelShuffle再構成による軽量な再パラメータ可能なバックボーンを使用して、コンパクトな推論グラフを生成する。
第1段階は空間的監督を伴う基本的な再構築マッピングを学習し、第2段階はシャルボニエの損失、DCTドメインの監督、第3段階はマンバの教師による信頼度重み付けされた出力レベルの蒸留を用いてフィリティを洗練し、第3段階は融合した展開グラフに直接量子化対応のトレーニングを適用する。
さらに、定量化安定性を向上させるために、重み切りとBatchNorm再校正を利用する。
MAI 2026 Quantized 4K Image Super-Resolution Challenge test set, our final AIO MAI submits achieves 29.79 dB PSNR and 0.8634 SSIM, obtained a final score of 1.8 under the target mobile INT8 deployment set。
ステージ3の最適化により、教師が指導するTFLiteの動的再構築は29.91 dB/0.853から30.0003 dB/0.856に改善され、固定形状のINT8 TFLiteアーティファクトは30.006 dB/0.857に達した。
関連論文リスト
- Decoder-Free Distillation for Quantized Image Restoration [10.108202910626536]
エッジ展開画像復元のためのフレームワークであるQDR(Quantization-Aware Distilled Restoration)を紹介する。
QDRはFP32自己蒸留による容量ミスマッチを排除し、デコーダフリー蒸留(DFD)による誤差増幅を防ぐ
また、競合する勾配の動的バランスをとるLearnerable Magnitude Reweighting (LMR)を提案する。
論文 参考訳(メタデータ) (2026-03-10T13:03:47Z) - D3R-Net: Dual-Domain Denoising Reconstruction Network for Robust Industrial Anomaly Detection [0.0]
非教師付き異常検出(UAD)は、現代の製造において、自動視覚検査の鍵となる要素である。
本稿では、D3R-Netについて紹介する。D3R-Netは、自己教師型「癒し」タスクと周波数認識正規化を結合したデュアルドメイン・デノベーション・コンストラクションフレームワークである。
空間平均二乗誤差に加えて、周波数領域の整合性を促進するFast Fourier Transform (FFT) 等級損失を用いる。
論文 参考訳(メタデータ) (2026-01-27T23:21:59Z) - EdgeFlex-Transformer: Transformer Inference for Edge Devices [2.1130318406254074]
視覚変換器(ViT)の圧縮・高速化を目的とした軽量で効果的な多段最適化パイプラインを提案する。
本手法は,アクティベーションプロファイリング,メモリ対応プルーニング,選択的混合精度実行,アクティベーション対応量子化(AWQ)を組み合わせることで,コストのかかるリトレーニングやタスク固有の微調整を必要とせずに,モデルのメモリフットプリントを削減する。
CIFAR-10の実験では、完全に最適化されたモデルはピークメモリ使用量の76%削減と6倍のレイテンシを実現し、元のFP32ベースラインと比較して精度を維持または改善している。
論文 参考訳(メタデータ) (2025-12-17T21:45:12Z) - PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution [95.98801201266099]
拡散に基づく画像超解像(SR)モデルでは、複数のデノナイジングステップのコストで優れた性能を示す。
本稿では,一段階拡散(OSD)画像SR,PassionSRにおける適応スケールの学習後量子化手法を提案する。
我々のPassionSRは、画像SRの最近の先進的な低ビット量子化法に対して大きな利点がある。
論文 参考訳(メタデータ) (2024-11-26T04:49:42Z) - The Surprising Effectiveness of Skip-Tuning in Diffusion Sampling [78.6155095947769]
Skip-Tuningは、スキップ接続上でシンプルだが驚くほど効果的にトレーニング不要なチューニング方法である。
ImageNet 64 では 19 NFE (1.75) で事前訓練された EDM に対して100% FID の改善が可能である。
Skip-Tuningは画素空間におけるスコアマッチング損失を増加させる一方、特徴空間における損失は減少する。
論文 参考訳(メタデータ) (2024-02-23T08:05:23Z) - Towards Clip-Free Quantized Super-Resolution Networks: How to Tame
Representative Images [16.18371675853725]
この研究は、非常に重要だがほとんど見落とされがちなポストトレーニング量子化ステップに焦点をあてる:代表データセット(RD)
本稿では,FP32モデルの出力のみを用いることで,RD画像を巧みに増大させる実験的な正当化を伴って,新しいパイプライン(クリップフリー量子化パイプライン,CFQP)を提案する。
論文 参考訳(メタデータ) (2023-08-22T11:41:08Z) - Make RepVGG Greater Again: A Quantization-aware Approach [22.36179771869403]
我々は、量子化に親しみやすい構造を持つための単純で堅牢で効果的な治療法を提案する。
ベルとホイッスルがなければ、ImageNetのトップ1の精度低下は、トレーニング後の標準的な量子化によって2%以内に減少する。
また,提案手法はRepVGGと同様のFP32性能を実現する。
論文 参考訳(メタデータ) (2022-12-03T11:14:10Z) - A New Backbone for Hyperspectral Image Reconstruction [90.48427561874402]
3次元ハイパースペクトル画像(HSI)再構成は、スナップショット圧縮画像の逆過程を指す。
空間/スペクトル不変Residual U-Net、すなわちSSI-ResU-Netを提案する。
SSI-ResU-Net は浮動小数点演算の 77.3% 以上で競合する性能を実現する。
論文 参考訳(メタデータ) (2021-08-17T16:20:51Z) - Training with Quantization Noise for Extreme Model Compression [57.51832088938618]
与えられたモデルサイズに対する精度を最大化しながら、コンパクトなモデルを作成するという問題に取り組む。
標準的な解決策は、トレーニング中に重みが定量化され、勾配がストレート・スルー推定器に近似される量子化意識訓練(Quantization Aware Training)でネットワークをトレーニングすることである。
本稿では, この手法を, 極端な圧縮法を用いて, int8 の固定点量子化を超えて機能するように拡張する。
論文 参考訳(メタデータ) (2020-04-15T20:10:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。