論文の概要: X-DECODE: EXtreme Deblurring with Curriculum Optimization and Domain Equalization
- arxiv url: http://arxiv.org/abs/2504.08072v1
- Date: Thu, 10 Apr 2025 18:59:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:19:04.502770
- Title: X-DECODE: EXtreme Deblurring with Curriculum Optimization and Domain Equalization
- Title(参考訳): X-DECODE: カリキュラム最適化とドメイン等化を併用したエクストリームデブロアリング
- Authors: Sushant Gautam, Jingdao Chen,
- Abstract要約: 鮮やかなぼやけた画像の復元は、コンピュータビジョンにとって依然として大きな課題だ。
本稿では,カリキュラム学習に基づく新たな学習戦略を導入し,画像の極端劣化に対する深層学習モデルの堅牢性を改善する。
- 参考スコア(独自算出の注目度): 2.348041867134616
- License:
- Abstract: Restoring severely blurred images remains a significant challenge in computer vision, impacting applications in autonomous driving, medical imaging, and photography. This paper introduces a novel training strategy based on curriculum learning to improve the robustness of deep learning models for extreme image deblurring. Unlike conventional approaches that train on only low to moderate blur levels, our method progressively increases the difficulty by introducing images with higher blur severity over time, allowing the model to adapt incrementally. Additionally, we integrate perceptual and hinge loss during training to enhance fine detail restoration and improve training stability. We experimented with various curriculum learning strategies and explored the impact of the train-test domain gap on the deblurring performance. Experimental results on the Extreme-GoPro dataset showed that our method outperforms the next best method by 14% in SSIM, whereas experiments on the Extreme-KITTI dataset showed that our method outperforms the next best by 18% in SSIM. Ablation studies showed that a linear curriculum progression outperforms step-wise, sigmoid, and exponential progressions, while hyperparameter settings such as the training blur percentage and loss function formulation all play important roles in addressing extreme blur artifacts. Datasets and code are available at https://github.com/RAPTOR-MSSTATE/XDECODE
- Abstract(参考訳): ひどくぼやけた画像の復元は、コンピュータビジョンにおいて重要な課題であり、自動運転、医療画像、写真などの応用に影響を与えている。
本稿では,カリキュラム学習に基づく新たな学習戦略を導入し,画像の極端劣化に対する深層学習モデルの堅牢性を改善する。
低から中程度のぼかしレベルのみを訓練する従来の手法とは異なり、我々の手法は、時間とともにぼかし度の高い画像を導入することで、徐々に困難を増し、モデルを漸進的に適応させることができる。
さらに, トレーニング中の知覚とヒンジの喪失を統合し, 細部修復を向上し, トレーニング安定性を向上させる。
各種カリキュラム学習戦略を実験し,試験領域間隙が劣化性能に及ぼす影響について検討した。
Extreme-GoProデータセットでは,SSIMでは14%,Extreme-KITTIデータセットでは18%,SSIMでは18%であった。
アブレーション研究では、線形カリキュラムの進行はステップワイド、シグミド、指数的進行よりも優れており、トレーニングブラーパーセンテージや損失関数の定式化といったハイパーパラメータ設定は、極端ブラーアーティファクトに対処する上で重要な役割を担っている。
データセットとコードはhttps://github.com/RAPTOR-MSSTATE/XDECODEで入手できる。
関連論文リスト
- FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。
既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。
実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:08:40Z) - X-Transfer: A Transfer Learning-Based Framework for GAN-Generated Fake
Image Detection [33.31312811230408]
顔置換などの偽画像を生成するためにGANを誤用することは、重大なセキュリティ上の懸念を引き起こす。
本稿では,新しい画像検出アルゴリズムであるX-Transferを提案する。
インターリーブされた並列勾配伝送を利用する2つのニューラルネットワークを利用することで、トランスファーラーニングを強化する。
論文 参考訳(メタデータ) (2023-10-07T01:23:49Z) - Accelerating Multiframe Blind Deconvolution via Deep Learning [0.0]
地上からの太陽画像の復元は計算に費用がかかる手続きである。
本稿では,アルゴリズムのアンロールに基づく復元を高速化する手法を提案する。
両手法が標準最適化法と比較して復元時間を大幅に短縮することを示した。
論文 参考訳(メタデータ) (2023-06-21T07:53:00Z) - Train smarter, not harder: learning deep abdominal CT registration on
scarce data [0.8179387741893692]
腹部画像における畳み込みニューラルネットワークによる画像-画像の登録を改善するためのトレーニング戦略について検討する。
訓練段階におけるセグメンテーションを用いた指導は、ディープラーニングに基づく画像登録に有用であることが証明された。
脳MRIデータセットから腹部CTデータセットまで、事前訓練されたモデルを微調整することで、パフォーマンスがさらに向上した。
論文 参考訳(メタデータ) (2022-11-28T19:03:01Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - On Efficient Transformer and Image Pre-training for Low-level Vision [74.22436001426517]
プレトレーニングは、ハイレベルコンピュータビジョンにおける多くの最先端の芸術である。
画像事前学習の詳細な研究について述べる。
低レベルのタスクでは,事前トレーニングが極めて異なる役割を担っています。
論文 参考訳(メタデータ) (2021-12-19T15:50:48Z) - A Loss Curvature Perspective on Training Instability in Deep Learning [28.70491071044542]
学習力学における損失の曲率の影響を理解するため,多くの分類課題における損失ヘッセンの進化について検討した。
条件付けの観点から,学習率のウォームアップはバッチ正規化と同じくらいのトレーニング安定性を向上できることを示した。
論文 参考訳(メタデータ) (2021-10-08T20:25:48Z) - Low-resolution Human Pose Estimation [49.531572116079026]
低分解能ポーズ推定のための信頼意識学習(CAL)手法を提案する。
CALは、既存のオフセット学習手法の2つの基本的な制限に対処する: 一貫性のないトレーニングとテスト、分離されたヒートマップとオフセット学習。
提案手法は,低分解能人間のポーズ推定における最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-09-19T09:13:57Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。