論文の概要: HQ-50K: A Large-scale, High-quality Dataset for Image Restoration
- arxiv url: http://arxiv.org/abs/2306.05390v1
- Date: Thu, 8 Jun 2023 17:44:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 13:08:55.284700
- Title: HQ-50K: A Large-scale, High-quality Dataset for Image Restoration
- Title(参考訳): HQ-50K:画像復元のための大規模で高品質なデータセット
- Authors: Qinhong Yang and Dongdong Chen and Zhentao Tan and Qiankun Liu and Qi
Chu and Jianmin Bao and Lu Yuan and Gang Hua and Nenghai Yu
- Abstract要約: HQ-50Kには5万の高品質の画像があり、テクスチャの詳細とセマンティックな多様性がある。
既存の画像復元データセットを5つの異なる視点から分析する。
HQ-50Kは、データキュレーションプロセスでこれら5つの側面をすべて考慮し、すべての要件を満たす。
- 参考スコア(独自算出の注目度): 105.22191357934398
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a new large-scale image restoration dataset, called
HQ-50K, which contains 50,000 high-quality images with rich texture details and
semantic diversity. We analyze existing image restoration datasets from five
different perspectives, including data scale, resolution, compression rates,
texture details, and semantic coverage. However, we find that all of these
datasets are deficient in some aspects. In contrast, HQ-50K considers all of
these five aspects during the data curation process and meets all requirements.
We also present a new Degradation-Aware Mixture of Expert (DAMoE) model, which
enables a single model to handle multiple corruption types and unknown levels.
Our extensive experiments demonstrate that HQ-50K consistently improves the
performance on various image restoration tasks, such as super-resolution,
denoising, dejpeg, and deraining. Furthermore, our proposed DAMoE, trained on
our \dataset, outperforms existing state-of-the-art unified models designed for
multiple restoration tasks and levels. The dataset and code are available at
\url{https://github.com/littleYaang/HQ-50K}.
- Abstract(参考訳): 本稿では,5万枚の高画質画像と,テクスチャの詳細とセマンティックな多様性を含むHQ-50Kという大規模画像復元データセットを提案する。
既存の画像復元データセットを,データスケール,解像度,圧縮率,テクスチャ詳細,セマンティクスカバレッジの5つの視点から分析する。
しかし、これらのデータセットは、いくつかの面で不足している。
対照的にHQ-50Kは、データキュレーションプロセスでこれら5つの側面をすべて考慮し、すべての要件を満たす。
また,複数の汚職タイプと未知のレベルを単一のモデルで処理可能な,エキスパート(damoe)モデルの分解対応混合も提案する。
HQ-50Kは高分解能,デノナイジング,デジペグ,デライニングなど,様々な画像復元タスクの性能を一貫して改善することを示す。
さらに,提案するDAMoEは,複数の修復作業やレベルのために設計された既存の最先端統一モデルよりも優れている。
データセットとコードは \url{https://github.com/littleyaang/hq-50k} で入手できる。
関連論文リスト
- InstructIR: High-Quality Image Restoration Following Human Instructions [68.73167409192746]
本稿では,人間の手書きによる画像復元モデルを導出する手法を提案する。
InstructIRという手法は、いくつかの修復作業において最先端の結果を得る。
論文 参考訳(メタデータ) (2024-01-29T18:53:33Z) - Self-Supervised Masked Digital Elevation Models Encoding for
Low-Resource Downstream Tasks [0.6374763930914523]
GeoAIは、何十年にもわたって収集されてきたデータのために、自己管理の方法論を活用することができる。
提案されたアーキテクチャは、ImageNetで事前トレーニングされたMasked Autoencoderである。
論文 参考訳(メタデータ) (2023-09-06T21:20:10Z) - A Comprehensive Study of Modern Architectures and Regularization
Approaches on CheXpert5000 [3.7384509727711923]
アノテーションを限定した医用画像分類法(5k)について検討する。
ImageNet21kで事前トレーニングされたモデルは、より高いAUCを実現し、より大きなモデルは、より少ないトレーニングステップを必要とする。
Vision Transformerは、Big Transfer Modelsと同等または同等の結果を得る。
論文 参考訳(メタデータ) (2023-02-13T20:51:24Z) - Learning Customized Visual Models with Retrieval-Augmented Knowledge [104.05456849611895]
我々は、ターゲットドメイン用にカスタマイズされたビジュアルモデルを構築するための、関連するWeb知識を取得するためのフレームワークであるREACTを提案する。
我々は、Webスケールデータベースから最も関連性の高い画像テキストペアを外部知識として検索し、元の重みをすべて凍結しながら、新しいモジュール化されたブロックをトレーニングするだけで、モデルをカスタマイズすることを提案する。
REACTの有効性は、ゼロ、少数、フルショット設定を含む分類、検索、検出、セグメンテーションタスクに関する広範な実験を通じて実証される。
論文 参考訳(メタデータ) (2023-01-17T18:59:06Z) - Learning Feature Disentanglement and Dynamic Fusion for Recaptured Image
Forensic [7.820667552233989]
我々は、画像再キャプチャーの4つのパターン、すなわち、モアレ再キャプチャー、エッジ再キャプチャー、アーティファクト再キャプチャー、その他の再キャプチャーとして、画像再キャプチャータスクを明示的に再定義する。
本稿では,異なる再キャプチャパターン認識をカバーするために,最も効果的な再キャプチャ表現を適応的に学習する機能ディスタングルとダイナミックフュージョン(FDDF)モデルを提案する。
我々の知る限り、我々はまず、再適応画像法学のための一般的なモデルと一般的な実シーンの大規模データセットを提案する。
論文 参考訳(メタデータ) (2022-06-13T12:47:13Z) - Highly Accurate Dichotomous Image Segmentation [139.79513044546]
Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。
私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。
また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
論文 参考訳(メタデータ) (2022-03-06T20:09:19Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Multi-modal Datasets for Super-resolution [12.079245552387361]
超高分解能(OID-RW)のための実世界の白黒写真データセットを提案する。
データセットには82のイメージのグループが含まれており、22の文字タイプと60のランドスケープとアーキテクチャのグループが含まれている。
また,マルチモーダル画像分解データセット(MDD400)を提案する。
論文 参考訳(メタデータ) (2020-04-13T07:39:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。