論文の概要: Towards Efficient Image Deblurring for Edge Deployment
- arxiv url: http://arxiv.org/abs/2601.11685v1
- Date: Fri, 16 Jan 2026 10:09:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.282193
- Title: Towards Efficient Image Deblurring for Edge Deployment
- Title(参考訳): エッジ展開のための効率的な画像デブロアリングを目指して
- Authors: Srinivas Miriyala, Sowmya Vajrala, Sravanth Kodavanti,
- Abstract要約: 画像の劣化は、モバイル画像信号処理パイプラインにおいて重要な段階であり、細かな構造やテクスチャを復元する能力は、エッジデバイスのリアルタイムな制約とバランスをとらなければならない。
本稿では, 感性誘導ブロック置換, シュロゲート蒸留, デバイスプロファイリングにより駆動されるトレーニング不要な多目的探索により, 既存モデルを再構成するハードウェア対応適応フレームワークを提案する。
36ブロックのNAFNetベースラインの適用により、最適化された変種は、最近のトランスフォーマーベースのSOTAと比較して最大55%のGMAC削減を実現し、競争の正確性を維持している。最も重要なのは、オンデバイスデプロイメントがベースラインよりも1.25倍のレイテンシ改善をもたらすことだ。
- 参考スコア(独自算出の注目度): 1.2234742322758418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image deblurring is a critical stage in mobile image signal processing pipelines, where the ability to restore fine structures and textures must be balanced with real-time constraints on edge devices. While recent deep networks such as transformers and activation-free architectures achieve state-of-the-art (SOTA) accuracy, their efficiency is typically measured in FLOPs or parameters, which do not correlate with latency on embedded hardware. We propose a hardware-aware adaptation framework that restructures existing models through sensitivity-guided block substitution, surrogate distillation, and training-free multi-objective search driven by device profiling. Applied to the 36-block NAFNet baseline, the optimized variants achieve up to 55% reduction in GMACs compared to the recent transformer-based SOTA while maintaining competitive accuracy. Most importantly, on-device deployment yields a 1.25X latency improvement over the baseline. Experiments on motion deblurring (GoPro), defocus deblurring (DPDD), and auxiliary benchmarks (RealBlur-J/R, HIDE) demonstrate the generality of the approach, while comparisons with prior efficient baselines confirm its accuracy-efficiency trade-off. These results establish feedback-driven adaptation as a principled strategy for bridging the gap between algorithmic design and deployment-ready deblurring models.
- Abstract(参考訳): 画像の劣化は、モバイル画像信号処理パイプラインにおいて重要な段階であり、細かな構造やテクスチャを復元する能力は、エッジデバイスのリアルタイムな制約とバランスをとらなければならない。
トランスフォーマーやアクティベーションフリーアーキテクチャといった最近のディープネットワークは、最先端(SOTA)の精度を達成するが、その効率は一般的にFLOPやパラメータで測定され、組込みハードウェアのレイテンシと相関しない。
本稿では, 感性誘導ブロック置換, シュロゲート蒸留, デバイスプロファイリングにより駆動されるトレーニング不要な多目的探索により, 既存モデルを再構成するハードウェア対応適応フレームワークを提案する。
36ブロックのNAFNetベースラインに適用すると、最適化された変種は、競争精度を維持しながら、最近の変圧器ベースのSOTAと比較して最大55%のGMACを削減できる。
最も重要な点として、デバイス上のデプロイメントでは、ベースラインよりも1.25倍のレイテンシが改善されている。
モーションデブロアリング(GoPro)、デフォーカスデブロアリング(DPDD)、補助ベンチマーク(RealBlur-J/R, HIDE)の実験では、アプローチの汎用性を示し、事前の効率的なベースラインとの比較では精度と効率のトレードオフを確認している。
これらの結果は、アルゴリズム設計とデプロイメント対応のデブロアリングモデルとのギャップを埋めるための原則的戦略としてフィードバック駆動型適応を確立している。
関連論文リスト
- FastBEV++: Fast by Algorithm, Deployable by Design [5.339716421285263]
本稿では,最新のパフォーマンスと車載デプロイメントのトラクタビリティを両立させるフレームワークであるFastBEV++を紹介する。
モノリシックなプロジェクションを標準のIndex-Gather-Reshapeパイプラインに分解する新しいビューパラダイムを通じて、"Deployable by Design"の原則を実現する。
論文 参考訳(メタデータ) (2025-12-09T04:37:46Z) - MOBIUS: Big-to-Mobile Universal Instance Segmentation via Multi-modal Bottleneck Fusion and Calibrated Decoder Pruning [91.90342432541138]
モデルサイズとトレーニングデータのスケールアップには、インスタンスレベルの知覚のための高度な基盤モデルがある。
資源制約されたプラットフォームにおける高い計算コスト制限。
我々は,高性能コンピューティングプラットフォームとモバイルデバイスの両方において,効率的なセグメンテーションのための新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2025-10-16T18:00:00Z) - Optimal Batch-Size Control for Low-Latency Federated Learning with Device Heterogeneity [30.53961003855146]
フェデレートラーニング(FL)は、第6世代(6G)ネットワークにおける協調機械学習の一般的なアプローチとして登場した。
FLアルゴリズムの展開は、自律運転、拡張現実、ヘルスケアなど、幅広いIoT(Internet-of-Things)アプリケーションを強化することが期待されている。
本稿では,収束性を確保しつつ,エンドツーエンド(E2E)学習遅延を最小限に抑える,バッチサイズ最適制御のための新しいC$2のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-21T13:24:38Z) - The Larger the Merrier? Efficient Large AI Model Inference in Wireless Edge Networks [56.37880529653111]
大規模計算モデル(LAIM)サービスの需要は、従来のクラウドベースの推論から、低レイテンシでプライバシ保護のアプリケーションのためのエッジベースの推論へのパラダイムシフトを推進している。
本稿では,事前学習したLAIMをデバイス上のサブモデルとサーバ上のサブモデルに分割して配置するLAIM推論方式について検討する。
論文 参考訳(メタデータ) (2025-05-14T08:18:55Z) - BEExformer: A Fast Inferencing Binarized Transformer with Early Exits [2.7651063843287718]
BAT(Binarized Early Exit Transformer)とEE(Early Exit)を統合した最初の選択型学習ベーストランスであるBEExformerを紹介する。
BATは符号関数に微分可能な二階近似を用い、重みの符号と大きさの両方を捉える勾配を可能にする。
EEメカニズムは、ソフトルーティング損失推定を伴う中間変圧器ブロック間のエントロピーの分数還元に係わる。
これにより、FLOPを52.08%削減して推論を加速し、深層ネットワークに固有の「過剰な」問題を解くことで精度を2.89%向上させる。
論文 参考訳(メタデータ) (2024-12-06T17:58:14Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。