論文の概要: Efficient Perceptual Image Super Resolution: AIM 2025 Study and Benchmark
- arxiv url: http://arxiv.org/abs/2510.12765v1
- Date: Tue, 14 Oct 2025 17:45:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.426119
- Title: Efficient Perceptual Image Super Resolution: AIM 2025 Study and Benchmark
- Title(参考訳): 知覚画像の高分解能化:AIM 2025研究とベンチマーク
- Authors: Bruno Longarela, Marcos V. Conde, Alvaro Garcia, Radu Timofte,
- Abstract要約: 我々は,厳密な効率制約を満たしつつ,Real-ESRGANの知覚結果を再現または改善することを目的としている。
提案手法は,500枚の4K解像度の試験画像からなる新しいデータセット上で評価され,それぞれが複数の劣化型を用いて劣化した。
最高パフォーマンスのアプローチは、すべてのベンチマークデータセットでReal-ESRGANを上回ります。
- 参考スコア(独自算出の注目度): 53.56717645904575
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a comprehensive study and benchmark on Efficient Perceptual Super-Resolution (EPSR). While significant progress has been made in efficient PSNR-oriented super resolution, approaches focusing on perceptual quality metrics remain relatively inefficient. Motivated by this gap, we aim to replicate or improve the perceptual results of Real-ESRGAN while meeting strict efficiency constraints: a maximum of 5M parameters and 2000 GFLOPs, calculated for an input size of 960x540 pixels. The proposed solutions were evaluated on a novel dataset consisting of 500 test images of 4K resolution, each degraded using multiple degradation types, without providing the original high-quality counterparts. This design aims to reflect realistic deployment conditions and serves as a diverse and challenging benchmark. The top-performing approach manages to outperform Real-ESRGAN across all benchmark datasets, demonstrating the potential of efficient methods in the perceptual domain. This paper establishes the modern baselines for efficient perceptual super resolution.
- Abstract(参考訳): 本稿では,EPSR (Efficient Perceptual Super-Resolution) に関する総合的研究と評価を行う。
効率的なPSNR指向超解像では大きな進歩があったが、知覚品質の指標に焦点をあてるアプローチは依然として比較的非効率である。
本研究の目的は,Real-ESRGANの知覚結果を,最大5Mパラメータと2000 GFLOP(入力サイズ960×540ピクセル)の厳密な効率制約を満たしながら再現あるいは改善することである。
提案手法は、4K解像度の500枚のテスト画像からなる新しいデータセット上で評価され、それぞれが複数の劣化型を用いて劣化し、元の高品質な画像は提供されなかった。
この設計は、現実的なデプロイメント条件を反映し、多様で挑戦的なベンチマークとして機能することを目的としている。
トップパフォーマンスのアプローチは、すべてのベンチマークデータセットでReal-ESRGANを上回り、知覚領域における効率的なメソッドの可能性を示す。
本稿では,効率的な知覚超解像のための現代的ベースラインを確立する。
関連論文リスト
- Efficient Real-World Deblurring using Single Images: AIM 2025 Challenge Report [59.64053782297197]
本稿では,単体画像チャレンジを用いたAIM 2025高効率実世界のデブロアリングについてレビューする。
この課題は、よく知られたRSBlurデータセットに基づいた新しいテストセットに基づいている。
最高性能のアプローチは、PSNRの31.1298 dBを達成し、この領域における効率的な手法の可能性を示した。
論文 参考訳(メタデータ) (2025-10-14T17:57:04Z) - Toward Advancing License Plate Super-Resolution in Real-World Scenarios: A Dataset and Benchmark [2.7961815663180425]
LPR(Super- resolution for License Plate Recognition)は、監視、交通監視、法医学的応用において、低解像度(LR)および劣化した画像によって引き起こされる課題に対処することを目的としている。
UFPR-SR-Platesは、10万のトラックと10万のペアの低解像度と高解像度のプレート画像を含む新しいデータセットである。
ライセンスプレートの超解像のための2つの最先端モデルと、車両毎の複数の逐次LRと高分解能(HR)画像を用いたベンチマークを構築した。
論文 参考訳(メタデータ) (2025-05-09T19:37:57Z) - Learning to Be a Transformer to Pinpoint Anomalies [12.442574943138794]
最近の産業異常検出およびIADS(Industrial Anomaly Detection and (IADS))は、224x224ピクセルなどの低解像度画像を処理する。
本稿では,高精細な入力画像を非常に効率的に処理しながら,強い事前学習機能を活用する新しい教師-学生パラダイムを提案する。
提案手法では,高解像度画像から異常を検出でき,競合他社よりも高速に動作可能である。
論文 参考訳(メタデータ) (2024-07-04T17:59:26Z) - From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution [3.5044007821404635]
空中物体検出は、小さな物体の大きさ、高密度クラスタリング、距離や動きのぼかしによる画質劣化などの課題を提示する。
B2BDetは、推論中にドメイン固有の超解像を適用し、拡張されたYOLOv5アーキテクチャを使って検出する2段階のフレームワークでこの問題に対処する。
このアプローチは、航空最適化SRGAN微調整とEAM(Efficient Attention Module)やCLFPN(Cross-Layer Feature Pyramid Network)といったアーキテクチャ革新を組み合わせる。
論文 参考訳(メタデータ) (2024-01-26T05:50:58Z) - EFaR 2023: Efficient Face Recognition Competition [51.77649060180531]
バイオメトリックス国際会議(IJCB 2023)における効率的な顔認識コンペティション(EFaR)の概要について述べる。
この競技会は6つの異なるチームから17の応募を受けた。
提案したソリューションは、様々なベンチマークで達成された検証精度の重み付けスコアと、浮動小数点演算数とモデルサイズによって与えられるデプロイ可能性に基づいてランク付けされる。
論文 参考訳(メタデータ) (2023-08-08T09:58:22Z) - Semantically Accurate Super-Resolution Generative Adversarial Networks [2.0454959820861727]
セマンティックセグメンテーションの性能を高めるために,新しいアーキテクチャとドメイン固有の特徴損失を提案する。
提案手法は,全ての予測クラスにおいて,知覚的画像品質と定量的セグメンテーションの精度を向上することを示す。
この研究は、画像ベースとタスク固有の損失を共同で検討することにより、両者のパフォーマンスを向上し、空中画像のセマンティック・アウェア・スーパーレゾリューションにおける最先端の進歩を実証する。
論文 参考訳(メタデータ) (2022-05-17T23:05:27Z) - Fully Quantized Image Super-Resolution Networks [81.75002888152159]
効率と精度を両立させるためのフル量子化画像超解像フレームワーク(FQSR)を提案する。
我々は、SRResNet、SRGAN、EDSRを含む複数の主流超解像アーキテクチャに量子化スキームを適用した。
低ビット量子化を用いたFQSRは、5つのベンチマークデータセットの完全精度と比較すると、パー性能で実現できる。
論文 参考訳(メタデータ) (2020-11-29T03:53:49Z) - AIM 2020 Challenge on Efficient Super-Resolution: Methods and Results [222.26973543552327]
本稿では,AIM 2020における高効率単一画像超解像の課題について概説する。
課題は、倍率x4の入力画像を超解凍することであった。
目標は、ランタイム、パラメータカウント、FLOP、アクティベーション、メモリ消費などの1つまたは複数の側面を減らすネットワークを考案することである。
論文 参考訳(メタデータ) (2020-09-15T09:25:51Z) - AR-Net: Adaptive Frame Resolution for Efficient Action Recognition [70.62587948892633]
行動認識はコンピュータビジョンにおいてオープンで困難な問題である。
本稿では,入力に条件付けされた各フレームの最適な解像度をオンザフライで選択し,効率的な動作認識を実現する,AR-Netと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-31T01:36:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。