論文の概要: Fast Omni-Directional Image Super-Resolution: Adapting the Implicit Image Function with Pixel and Semantic-Wise Spherical Geometric Priors
- arxiv url: http://arxiv.org/abs/2502.05902v1
- Date: Sun, 09 Feb 2025 13:37:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:32:01.089945
- Title: Fast Omni-Directional Image Super-Resolution: Adapting the Implicit Image Function with Pixel and Semantic-Wise Spherical Geometric Priors
- Title(参考訳): 高速オムニディショナル画像超解法:PixelとSemantic-Wise Spherical Geometric Priorsによるインシシシト画像関数の適応
- Authors: Xuelin Shen, Yitong Wang, Silin Zheng, Kang Xiao, Wenhan Yang, Xu Wang,
- Abstract要約: 本稿では,高速かつ任意スケールのODI-SRプロセスを実行する能力を特徴とする新しいODI-SRモデルを提案する。
提案したFAORは、より高速な推論速度で最先端のODI-SRモデルより優れている。
- 参考スコア(独自算出の注目度): 38.580815475638595
- License:
- Abstract: In the context of Omni-Directional Image (ODI) Super-Resolution (SR), the unique challenge arises from the non-uniform oversampling characteristics caused by EquiRectangular Projection (ERP). Considerable efforts in designing complex spherical convolutions or polyhedron reprojection offer significant performance improvements but at the expense of cumbersome processing procedures and slower inference speeds. Under these circumstances, this paper proposes a new ODI-SR model characterized by its capacity to perform Fast and Arbitrary-scale ODI-SR processes, denoted as FAOR. The key innovation lies in adapting the implicit image function from the planar image domain to the ERP image domain by incorporating spherical geometric priors at both the latent representation and image reconstruction stages, in a low-overhead manner. Specifically, at the latent representation stage, we adopt a pair of pixel-wise and semantic-wise sphere-to-planar distortion maps to perform affine transformations on the latent representation, thereby incorporating it with spherical properties. Moreover, during the image reconstruction stage, we introduce a geodesic-based resampling strategy, aligning the implicit image function with spherical geometrics without introducing additional parameters. As a result, the proposed FAOR outperforms the state-of-the-art ODI-SR models with a much faster inference speed. Extensive experimental results and ablation studies have demonstrated the effectiveness of our design.
- Abstract(参考訳): Omni-Directional Image (ODI) Super-Resolution (SR) の文脈では、固有課題は、EquiRectular Projection (ERP) によって生じる非均一なオーバーサンプリング特性から生じる。
複雑な球面の畳み込みやポリヘドロン再計画の設計における重要な取り組みは、大幅な性能向上をもたらすが、面倒な処理手順と推論速度の遅さを犠牲にしている。
そこで本稿では, FAOR で表される高速・任意スケール ODI-SR プロセスの実行能力を特徴とする新しい ODI-SR モデルを提案する。
重要な革新は、平面画像領域からERP画像領域への暗黙のイメージ関数の適応であり、ラテント表現と画像再構成段階の両方で球面幾何学的先行を低オーバーヘッドで組み込むことである。
具体的には、潜在表現段階では、一対のピクセルワイドとセマンティックワイドの球面-平面歪み写像を用いて、潜在表現上のアフィン変換を行い、球面特性に組み込む。
さらに,画像再構成の段階では,新たなパラメータを導入することなく,暗黙的画像関数と球面幾何学を整列する測地的再サンプリング戦略を導入する。
その結果、提案したFAORは、より高速な推論速度で最先端のODI-SRモデルより優れていた。
大規模な実験結果とアブレーション研究により,本設計の有効性が示された。
関連論文リスト
- Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。
実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。
我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-29T07:14:16Z) - Invertible Neural Warp for NeRF [29.00183106905031]
本稿では、ポーズとニューラルラジアンスフィールド(NeRF)の同時最適化に取り組む。
本稿では,モデルカメラが学習可能な剛性ワープ関数として機能する,パラメータの過剰表現を提案する。
提案手法は,合成および実世界のデータセットにおいて,ポーズ推定や高忠実度再構成の点で,既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-07-17T07:14:08Z) - Geometric Distortion Guided Transformer for Omnidirectional Image Super-Resolution [26.819508321968108]
GDGT-OSR (Geometric Distortion Guided Transformer for Omdirectional Image Super-Resolution) について紹介する。
具体的には、変形可能な自己アテンションと統合された歪変調矩形ウィンドウ自己アテンション機構を提案し、歪みをよりよく知覚する。
新たなGDGT-OSRは既存の文献の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-16T09:38:33Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Physics-Inspired Degradation Models for Hyperspectral Image Fusion [61.743696362028246]
ほとんどの融合法は、融合アルゴリズム自体にのみ焦点をあて、分解モデルを見落としている。
我々は、LR-HSIとHR-MSIの劣化をモデル化するための物理インスパイアされた劣化モデル(PIDM)を提案する。
提案したPIDMは,既存の核融合法における核融合性能を向上させることができる。
論文 参考訳(メタデータ) (2024-02-04T09:07:28Z) - BID-NeRF: RGB-D image pose estimation with inverted Neural Radiance
Fields [0.0]
Inverted Neural Radiance Fields (iNeRF) アルゴリズムの改良を目標とし、画像ポーズ推定問題をNeRFに基づく反復線形最適化として定義する。
NeRFは、現実世界のシーンやオブジェクトのフォトリアリスティックな新しいビューを合成できる新しい空間表現モデルである。
論文 参考訳(メタデータ) (2023-10-05T14:27:06Z) - High-Dimensional MR Reconstruction Integrating Subspace and Adaptive
Generative Models [21.719520686704474]
本稿では,高次元MR画像再構成に先立って,サブスペースモデリングと適応生成画像を統合する手法を提案する。
高速MRパラメータマッピングと高分解能MRSIの2つの高次元イメージングアプリケーションで提案手法の有用性を評価した。
論文 参考訳(メタデータ) (2023-06-14T16:43:14Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Implicit Neural Representation Learning for Hyperspectral Image
Super-Resolution [0.0]
Inlicit Neural Representations (INR)は、新しい効果的な表現として進歩を遂げている。
本稿では、空間座標を対応するスペクトル放射率値にマッピングする連続関数により、HSIを表すINRに基づく新しいHSI再構成モデルを提案する。
論文 参考訳(メタデータ) (2021-12-20T14:07:54Z) - Light Field Reconstruction Using Convolutional Network on EPI and
Extended Applications [78.63280020581662]
スパースビューからの光場再構成のための新しい畳み込みニューラルネットワーク(CNN)ベースのフレームワークを開発した。
最先端のアルゴリズムと比較して,提案フレームワークの高性能と堅牢性を実証する。
論文 参考訳(メタデータ) (2021-03-24T08:16:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。