論文の概要: Devignet: High-Resolution Vignetting Removal via a Dual Aggregated
Fusion Transformer With Adaptive Channel Expansion
- arxiv url: http://arxiv.org/abs/2308.13739v1
- Date: Sat, 26 Aug 2023 02:55:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 19:26:07.532758
- Title: Devignet: High-Resolution Vignetting Removal via a Dual Aggregated
Fusion Transformer With Adaptive Channel Expansion
- Title(参考訳): Devignet: アダプティブチャネルを拡張したデュアルアグリゲーション・フュージョン・トランスによる高分解能Vignetting除去
- Authors: Shenghong Luo, Xuhang Chen, Weiwen Chen, Zinuo Li, Shuqiang Wang,
Chi-Man Pun
- Abstract要約: Vignettingは一般的に、レンズ設計、不適切なレンズフードの使用、カメラセンサーの制限などの要因から生じる画像に発生する。
ウィグレット除去のための先駆的なデータセットであるVigsetを紹介する。
DeVigNetは、ナビゲート除去用に設計された新しい周波数対応トランスフォーマーアーキテクチャである。
- 参考スコア(独自算出の注目度): 34.99543751199565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vignetting commonly occurs as a degradation in images resulting from factors
such as lens design, improper lens hood usage, and limitations in camera
sensors. This degradation affects image details, color accuracy, and presents
challenges in computational photography. Existing vignetting removal algorithms
predominantly rely on ideal physics assumptions and hand-crafted parameters,
resulting in ineffective removal of irregular vignetting and suboptimal
results. Moreover, the substantial lack of real-world vignetting datasets
hinders the objective and comprehensive evaluation of vignetting removal. To
address these challenges, we present Vigset, a pioneering dataset for vignette
removal. Vigset includes 983 pairs of both vignetting and vignetting-free
high-resolution ($5340\times3697$) real-world images under various conditions.
In addition, We introduce DeVigNet, a novel frequency-aware Transformer
architecture designed for vignetting removal. Through the Laplacian Pyramid
decomposition, we propose the Dual Aggregated Fusion Transformer to handle
global features and remove vignetting in the low-frequency domain.
Additionally, we introduce the Adaptive Channel Expansion Module to enhance
details in the high-frequency domain. The experiments demonstrate that the
proposed model outperforms existing state-of-the-art methods.
- Abstract(参考訳): Vignettingは一般的に、レンズ設計、不適切なレンズフードの使用、カメラセンサーの制限などの要因から生じる画像の劣化として発生する。
この劣化は、画像の詳細、色精度に影響を与え、計算写真における課題を示す。
既存のウィグネット除去アルゴリズムは主に理想的な物理仮定と手作りパラメータに依存しており、不規則なヴィグネット除去と準最適結果の非効率な除去をもたらす。
さらに、実世界のビグネッティングデータセットの実質的な欠如は、ビグネッティング削除の客観的かつ総合的な評価を妨げる。
これらの課題に対処するために,vignette削除のための先駆的なデータセットであるvigsetを提案する。
vigsetには、様々な条件下でのvinettingとvignetting-freeの両方の高精細度画像(5340\times3697$)が含まれている。
さらに,新たな周波数認識トランスフォーマアーキテクチャであるdevignetを導入する。
ラプラシアンピラミッド分解により,グローバルな特徴を処理し,低周波領域での磁化を除去するDual Aggregated Fusion Transformerを提案する。
さらに,高周波領域の詳細を強化するために,適応チャネル拡張モジュールを導入する。
実験により,提案モデルが既存の最先端手法より優れていることが示された。
関連論文リスト
- Disentangled Generation and Aggregation for Robust Radiance Fields [25.865597946144163]
三面体ベースの放射場は、高品質な表現と低コストな計算で、3Dシーンを効果的に切り離すことができる。
しかし、トリプレーンの局所的な更新特性のため、前回のポーズ-NeRF最適化と同様の関節推定は局所的なミニマで容易に実現できる。
本研究では,三面学習にグローバルな特徴コンテキストと滑らかさを導入するために,Distangled Triplane Generationモジュールを提案する。
さらに,三葉機発電機による暗黙的制約を軽減するために,2段階のウォームスタートトレーニング戦略を導入する。
論文 参考訳(メタデータ) (2024-09-24T04:01:26Z) - Domain-adaptive Video Deblurring via Test-time Blurring [43.40607572991409]
未確認領域におけるデブロアリングモデルに対するテスト時間微調整を実現するために, ぼかしモデルに基づくドメイン適応方式を提案する。
そこで本手法では, 対象領域の劣化モデルを校正するために, ドメイン適応型トレーニングペアを生成することができる。
提案手法は,最先端の映像復号化手法を大幅に改善し,実世界の映像復号化データセットに対して最大7.54dBの性能向上を実現する。
論文 参考訳(メタデータ) (2024-07-12T07:28:01Z) - Zero-Shot Video Editing through Adaptive Sliding Score Distillation [51.57440923362033]
本研究は,オリジナルビデオコンテンツの直接操作を容易にする,ビデオベースのスコア蒸留の新たなパラダイムを提案する。
本稿では,グローバルとローカルの両方の動画ガイダンスを取り入れた適応スライディングスコア蒸留方式を提案する。
論文 参考訳(メタデータ) (2024-06-07T12:33:59Z) - Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - CNN Injected Transformer for Image Exposure Correction [20.282217209520006]
畳み込みに基づく以前の露光補正法は、しばしば画像の露光偏差を生じさせる。
本稿では,CNN と Transformer の個々の強度を同時に活用する CNN インジェクトトランス (CIT) を提案する。
露光補正のためのハイブリッドアーキテクチャ設計に加えて、空間コヒーレンスを改善し、潜在的な色偏差を補正するために、慎重に定式化された損失関数のセットを適用する。
論文 参考訳(メタデータ) (2023-09-08T14:53:00Z) - TartanCalib: Iterative Wide-Angle Lens Calibration using Adaptive
SubPixel Refinement of AprilTags [23.568127229446965]
現在の最先端技術による広角レンズの校正は、エッジの極端に歪みがあるため、結果を得られない。
精度の高い広角キャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2022-10-05T18:57:07Z) - AVA: Adversarial Vignetting Attack against Visual Recognition [20.995444545062707]
我々は,新しい視点,すなわちadversarial vignetting attack (ava) からヴィネッティングを研究する。
AVAは意図的に誤解を招く情報をvignettingに埋め込んで、ノイズパターンのない自然な逆転例を作り出します。
この例は最先端の深層畳み込みニューラルネットワーク(CNN)を騙すことができるが、人間には受け入れられない。
論文 参考訳(メタデータ) (2021-05-12T10:18:16Z) - Designing a Practical Degradation Model for Deep Blind Image
Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。
本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文 参考訳(メタデータ) (2021-03-25T17:40:53Z) - Adaptive Debanding Filter [55.42929350861115]
バンディングアーティファクトは、写真やビデオフレームに階段のような色のバンドとして現れます。
後処理モジュールとして,コンテンツ適応型スムースなフィルタリングと拡張量子化を提案する。
実験結果から,提案した解離フィルタは,最先端の偽輪郭除去アルゴリズムよりも視覚的,定量的に優れていることがわかった。
論文 参考訳(メタデータ) (2020-09-22T20:44:20Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。