論文の概要: 1st Place Solutions for UG2+ Challenge 2022 ATMOSPHERIC TURBULENCE
MITIGATION
- arxiv url: http://arxiv.org/abs/2210.16847v1
- Date: Sun, 30 Oct 2022 14:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 17:44:48.116007
- Title: 1st Place Solutions for UG2+ Challenge 2022 ATMOSPHERIC TURBULENCE
MITIGATION
- Title(参考訳): UG2+チャレンジ2022における第1位解法
- Authors: Zhuang Liu, Zhichao Zhao, Ye Yuan, Zhi Qiao, Jinfeng Bai and Zhilong
Ji
- Abstract要約: 歪んだフレームから高品質な画像を再構成するための統一的なエンドツーエンドフレームワークを提案する。
我々のフレームワークは効率的で汎用的であり、ホットエアイメージとテキストパターンの両方に対応しています。
テキストパターンの復元結果の平均精度は98.53%に達し、最終リーダーボードで1位となった。
- 参考スコア(独自算出の注目度): 11.380487356442863
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this technical report, we briefly introduce the solution of our team
''summer'' for Atomospheric Turbulence Mitigation in UG$^2$+ Challenge in CVPR
2022. In this task, we propose a unified end-to-end framework to reconstruct a
high quality image from distorted frames, which is mainly consists of a
Restormer-based image reconstruction module and a NIMA-based image quality
assessment module. Our framework is efficient and generic, which is adapted to
both hot-air image and text pattern. Moreover, we elaborately synthesize more
than 10 thousands of images to simulate atmospheric turbulence. And these
images improve the robustness of the model. Finally, we achieve the average
accuracy of 98.53\% on the reconstruction result of the text patterns, ranking
1st on the final leaderboard.
- Abstract(参考訳): 本稿では,UG$^2$+ Challenge in CVPR 2022において,原子圏乱流緩和のためのチーム「サマー」のソリューションを簡潔に紹介する。
本研究では,レストーナベース画像再構成モジュールとnimaベース画像品質評価モジュールを主とする,変形フレームから高品質画像を構築するための統一的なエンドツーエンドフレームワークを提案する。
我々のフレームワークは効率的で汎用的で、ホットエアイメージとテキストパターンの両方に対応しています。
さらに,1万枚以上の画像を精巧に合成し,大気乱流をシミュレートした。
これらの画像はモデルの堅牢性を向上させる。
最後に,テキストパターンの復元結果において平均98.53\%の精度を達成し,最終リーダボードでは1位となった。
関連論文リスト
- Interleaved Scene Graph for Interleaved Text-and-Image Generation Assessment [53.45813302866466]
我々は、インターリーブされたテキスト・画像生成のための総合的な評価フレームワークISGを提案する。
ISGは、全体性、構造性、ブロックレベル、画像固有性の4つのレベルで反応を評価する。
ISGと組み合わせて、ISG-Benchというベンチマークを導入し、8つのカテゴリと21のサブカテゴリにわたる1,150のサンプルを網羅した。
論文 参考訳(メタデータ) (2024-11-26T07:55:57Z) - Emu: Enhancing Image Generation Models Using Photogenic Needles in a
Haystack [75.00066365801993]
Webスケールの画像-テキストペアによるテキスト-画像モデルのトレーニングにより、テキストから幅広い視覚概念を生成することができる。
これらの事前訓練されたモデルは、高度に美的な画像を生成することに関して、しばしば課題に直面します。
本稿では,高度に視覚的に魅力的な画像のみを生成するために,事前学習されたモデルを誘導する品質チューニングを提案する。
論文 参考訳(メタデータ) (2023-09-27T17:30:19Z) - Physics-Driven Turbulence Image Restoration with Stochastic Refinement [80.79900297089176]
大気乱流による画像歪みは、長距離光学画像システムにおいて重要な問題である。
ディープラーニングモデルが現実世界の乱流条件に適応するために、高速で物理学的なシミュレーションツールが導入された。
本稿では,物理統合復元ネットワーク(PiRN)を提案する。
論文 参考訳(メタデータ) (2023-07-20T05:49:21Z) - 1st Solution Places for CVPR 2023 UG$^2$+ Challenge Track 2.2-Coded
Target Restoration through Atmospheric Turbulence [12.484269899245515]
本報告では,CVPR 2023 UG$2$+トラック2.2における大気乱流によるターゲット復元のためのVIELab-HUSTの解について紹介する。
歪んだフレームから高品質な画像を復元するための効率的な多段階フレームワークを提案する。
我々のフレームワークは、最終テストフェーズで提供されるさまざまな種類のコード化されたターゲットデータセットを処理でき、最終リーダーボードで1位にランクインしています。
論文 参考訳(メタデータ) (2023-06-15T09:06:48Z) - 1st Solution Places for CVPR 2023 UG$^{\textbf{2}}$+ Challenge Track
2.1-Text Recognition through Atmospheric Turbulence [13.393698451466689]
CVPR 2023 UG$2$+チャレンジのトラック2.1における大気乱流によるテキスト認識のためのVIELab-HUSTの開発したソリューションを提案する。
本フレームワークは,最終テストフェーズで提供されるホットエアテキストデータセットと乱流テキストデータセットの両方を処理し,テキスト認識精度において第1位を達成した。
論文 参考訳(メタデータ) (2023-06-15T08:56:51Z) - A Two-Stage Real Image Deraining Method for GT-RAIN Challenge CVPR 2023
Workshop UG$^{\textbf{2}}$+ Track 3 [15.370704973282848]
雨のフレームから鮮明な画像を再構成する2段階の効率的なフレームワークを提案する。
変圧器をベースとした単一画像デライニングネットワークUformerは,大規模な降雨データセット上で事前トレーニングを行うために実装されている。
われわれのフレームワークは精巧に設計されており、豪雨と霧の双方を処理できる。
論文 参考訳(メタデータ) (2023-05-13T18:30:27Z) - Dual-former: Hybrid Self-attention Transformer for Efficient Image
Restoration [6.611849560359801]
本稿では,自己アテンションモジュールの強力なグローバルモデリング能力と,全体のアーキテクチャにおける畳み込みの局所モデリング能力を組み合わせたDual-formerを提案する。
実験により、Dual-formerはIndoorデータセットの最先端MAXIM法よりも1.91dBのゲインを達成していることが示された。
単一画像のデライニングでは、わずか21.5%のGFLOPを持つ5つのデータセットの平均結果に対して、SOTA法を0.1dB PSNRで上回っている。
論文 参考訳(メタデータ) (2022-10-03T16:39:21Z) - 2nd Place Solutions for UG2+ Challenge 2022 -- D$^{3}$Net for Mitigating
Atmospheric Turbulence from Images [5.092028049119383]
D$3$Netは、CVPR 2022のUG2+$ Challengeにおける大気乱流緩和のために、我々のチーム「TUK-IK」によって提案された。
提案手法は, テストフェーズにおいて, 上記の課題の最終リーダーボードにそれぞれ2位にランクインした。
論文 参考訳(メタデータ) (2022-08-25T20:20:09Z) - Single Frame Atmospheric Turbulence Mitigation: A Benchmark Study and A
New Physics-Inspired Transformer Model [82.23276183684001]
本研究では,大気乱流の画像化のための物理インスピレーション付き変圧器モデルを提案する。
提案ネットワークは変圧器ブロックのパワーを利用して動的乱流歪みマップを共同で抽出する。
そこで本研究では,従来の客観的指標と,テキスト認識精度を用いたタスク駆動計測の両方で評価可能な,実世界の乱流データセットを新たに2つ提示する。
論文 参考訳(メタデータ) (2022-07-20T17:09:16Z) - Improved Transformer for High-Resolution GANs [69.42469272015481]
この課題に対処するために、Transformerに2つの重要な要素を紹介します。
実験で提案したHiTは、条件のないImageNetの31.87と2.95のFIDスコアをそれぞれ128×128$とFFHQの256×256$で達成していることを示す。
論文 参考訳(メタデータ) (2021-06-14T17:39:49Z) - Aggregated Contextual Transformations for High-Resolution Image
Inpainting [57.241749273816374]
画像の高精細化のための拡張GANモデルAggregated Contextual-Transformation GAN (AOT-GAN)を提案する。
そこで,提案するAOTブロックの複数のレイヤを積み重ねることで,AOT-GANのジェネレータを構築する。
テクスチャ合成を改善するため,AOT-GANの識別をマスク予測タスクでトレーニングすることで強化する。
論文 参考訳(メタデータ) (2021-04-03T15:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。