論文の概要: Human Vision Constrained Super-Resolution
- arxiv url: http://arxiv.org/abs/2411.17513v2
- Date: Tue, 26 Aug 2025 09:27:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.441436
- Title: Human Vision Constrained Super-Resolution
- Title(参考訳): 人間の視力に制約された超解像
- Authors: Volodymyr Karpenko, Taimoor Tariq, Jorge Condor, Piotr Didyk,
- Abstract要約: 本稿では,人間の感性に応じてSR法を導出する明示的なヒューマンビジュアル処理フレームワーク(HVPF)を提案する。
本稿では、SR手法の計算効率を向上させるために、ネットワーク分岐と組み合わせてフレームワークの応用を実証する。
- 参考スコア(独自算出の注目度): 7.6097181983152185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern deep-learning super-resolution (SR) techniques process images and videos independently of the underlying content and viewing conditions. However, the sensitivity of the human visual system (HVS) to image details changes depending on the underlying image characteristics, such as spatial frequency, luminance, color, contrast, or motion; as well viewing condition aspects such as ambient lighting and distance to the display. This observation suggests that computational resources spent on up-sampling images/videos may be wasted whenever a viewer cannot resolve the synthesized details i.e the resolution of details exceeds the resolving capability of human vision. Motivated by this observation, we propose a human vision inspired and architecture-agnostic approach for controlling SR techniques to deliver visually optimal results while limiting computational complexity. Its core is an explicit Human Visual Processing Framework (HVPF) that dynamically and locally guides SR methods according to human sensitivity to specific image details and viewing conditions. We demonstrate the application of our framework in combination with network branching to improve the computational efficiency of SR methods. Quantitative and qualitative evaluations, including user studies, demonstrate the effectiveness of our approach in reducing FLOPS by factors of 2$\times$ and greater, without sacrificing perceived quality.
- Abstract(参考訳): 最新のディープラーニング・スーパーレゾリューション(SR)技術は、基礎となるコンテンツや視聴条件とは無関係に、画像やビデオを処理している。
しかし、人間の視覚システム(HVS)のイメージ細部への感度は、空間周波数、輝度、色、コントラスト、動きなどの画像特性によって変化し、周囲の照明やディスプレイの距離などの視界条件も変化する。
この観察は、映像やビデオのアップサンプリングに費やした計算資源は、視聴者が合成された詳細を解決できないときに無駄になる可能性があることを示唆している。
本研究は,人間の視覚に触発されたアーキテクチャに依存しない,SR手法を制御し,計算複雑性を抑えながら視覚的に最適な結果を提供する手法を提案する。
その中核は明示的なヒューマン・ビジュアル・プロセッシング・フレームワーク(HVPF)であり、特定の画像の詳細や視聴条件に対する人間の感度に応じてSRメソッドを動的かつ局所的にガイドする。
本稿では、SR手法の計算効率を向上させるために、ネットワーク分岐と組み合わせてフレームワークの応用を実証する。
ユーザスタディを含む定量的・質的な評価は, 知覚品質を犠牲にすることなく, 2$\times$以上の要因によるFLOPSの低減効果を示す。
関連論文リスト
- Implicit Neural Representation for Video and Image Super-Resolution [4.960738913876514]
暗黙的ニューラル表現(INR)を用いた超解像の新手法を提案する。
提案手法は,低分解能入力と3次元高分解能グリッドのみを用いた高分解能再構成を容易にする。
提案手法であるSR-INRは,フレームと画像間の一貫した詳細を維持し,時間的安定性を著しく向上させる。
論文 参考訳(メタデータ) (2025-03-06T17:58:55Z) - HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning [62.264673293638175]
既存の水中画像強調法は主に視覚的品質の向上に重点を置いており、実際的な意味を見落としている。
視覚的品質を高め,他の下流タスクに対処する柔軟性を示す,水中知覚向上のための可逆的ネットワークHを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:37:03Z) - Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network [8.739451985459638]
超解像アルゴリズムは、同一シーンから撮影された1つ以上の低解像度画像を高解像度画像に変換する。
再構成過程における画像の特徴抽出と非線形マッピング手法は,既存のアルゴリズムでは依然として困難である。
目的は、高解像度の画像から高品質で高解像度の画像を復元することである。
論文 参考訳(メタデータ) (2024-07-18T06:50:39Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - A General Method to Incorporate Spatial Information into Loss Functions for GAN-based Super-resolution Models [25.69505971220203]
GAN(Generative Adversarial Networks)は超解像問題において優れた性能を示した。
GANは、予期せぬアーチファクトやノイズなど、出力に副作用をもたらすことが多い。
本稿では,多くのGANベース超解像(SR)モデルにおいて,トレーニングプロセスに必須空間情報を導入することで,効果的に活用できる汎用手法を提案する。
論文 参考訳(メタデータ) (2024-03-15T17:29:16Z) - Reimagining Reality: A Comprehensive Survey of Video Inpainting
Techniques [6.36998581871295]
ビデオ・インペイント(英: Video inpainting)とは、ビデオ・シーケンスの欠落や破損した部分を再生または埋めるプロセスである。
本研究は, 主要な技術, その基盤となる理論, 有効利用を分解する。
我々は、視覚的品質を評価するために人間中心のアプローチを採用し、異なる映像塗装技術の出力を評価するためにアノテータのパネルを登録する。
論文 参考訳(メタデータ) (2024-01-31T14:41:40Z) - Neural Point-based Volumetric Avatar: Surface-guided Neural Points for
Efficient and Photorealistic Volumetric Head Avatar [62.87222308616711]
ニューラルポイント表現とニューラルボリュームレンダリングプロセスを採用したフルネーム(名前)を提案する。
具体的には、ニューラルポイントは高分解能UV変位マップを介してターゲット表現の表面を戦略的に拘束する。
設計上は,アバターをアニメーションする際の正確な表現制御を確保しつつ,地形的に変化する領域や細い構造を扱えるように設計されている。
論文 参考訳(メタデータ) (2023-07-11T03:40:10Z) - Textural-Structural Joint Learning for No-Reference Super-Resolution
Image Quality Assessment [59.91741119995321]
我々は、TSNetと呼ばれる品質予測のためのテキスト情報と構造情報を共同で探索するデュアルストリームネットワークを開発した。
画像の重要な領域に注意を払っている人間の視覚システム(HVS)を模倣することにより、視覚に敏感な領域をより区別しやすくするための空間的注意機構を開発する。
実験の結果,提案したTSNetは現状のIQA法よりも視覚的品質を正確に予測し,人間の視点との整合性を示した。
論文 参考訳(メタデータ) (2022-05-27T09:20:06Z) - Learning GAN-based Foveated Reconstruction to Recover Perceptually
Important Image Features [0.0]
本研究では, 埋設工法を効率的に指導する上での問題点を考察する。
私たちの一番の目標は、人間が検出できない歪みに対してトレーニング手順の感度を下げることです。
評価の結果, 画像再構成の精度は, GANベースのトレーニング手法に比べて有意に向上した。
論文 参考訳(メタデータ) (2021-08-07T18:39:49Z) - Analysis and evaluation of Deep Learning based Super-Resolution
algorithms to improve performance in Low-Resolution Face Recognition [0.0]
超解像アルゴリズムは、関係する被験者の識別特性を回復することができる。
このプロジェクトは、顔の超解像のタスクのための異なるディープニューラルネットワークアーキテクチャを評価し、適応することを目的とした。
実験により、一般的なスーパーレゾリューションアーキテクチャは、高レゾリューション顔で訓練されたディープニューラルネットワークのフェイス検証性能を向上させることが判明した。
論文 参考訳(メタデータ) (2021-01-19T02:41:57Z) - Deep Learning-based Face Super-resolution: A Survey [78.11274281686246]
顔の超解像、別名顔の幻覚は、ドメイン固有のイメージの超解像問題です。
現在、深層学習に基づく顔の超解像に関する研究の要約は少ない。
本調査では,超解像面における深層学習の手法を体系的に総合的に検討する。
論文 参考訳(メタデータ) (2021-01-11T08:17:11Z) - Interpretable Detail-Fidelity Attention Network for Single Image
Super-Resolution [89.1947690981471]
本研究では,スムースとディテールを段階的に分割・収束的に処理する,目的・解釈可能なディテール・ファイダリティ・アテンション・ネットワークを提案する。
特に,詳細推論において顕著な解釈可能な特徴表現のためのヘシアンフィルタを提案する。
実験により,提案手法は最先端手法よりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-09-28T08:31:23Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。