論文の概要: Multi-level distortion-aware deformable network for omnidirectional image super-resolution
- arxiv url: http://arxiv.org/abs/2512.17343v1
- Date: Fri, 19 Dec 2025 08:35:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.309554
- Title: Multi-level distortion-aware deformable network for omnidirectional image super-resolution
- Title(参考訳): 全方位画像超解像のためのマルチレベル歪み対応変形性ネットワーク
- Authors: Cuixin Yang, Rongkang Dong, Kin-Man Lam, Yuhang Zhang, Guoping Qiu,
- Abstract要約: 我々は,OmniDirectional Images(ODI)のための新しいMDDN(Multi-level Distortion-aware Deformable Network)を提案する。
このアーキテクチャはサンプリング範囲を拡張し、より広い領域にわたって歪んだパターンを含む。
公開データセットの実験では、MDDNが最先端のメソッドより優れていることが示されている。
- 参考スコア(独自算出の注目度): 25.937762776025718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As augmented reality and virtual reality applications gain popularity, image processing for OmniDirectional Images (ODIs) has attracted increasing attention. OmniDirectional Image Super-Resolution (ODISR) is a promising technique for enhancing the visual quality of ODIs. Before performing super-resolution, ODIs are typically projected from a spherical surface onto a plane using EquiRectangular Projection (ERP). This projection introduces latitude-dependent geometric distortion in ERP images: distortion is minimal near the equator but becomes severe toward the poles, where image content is stretched across a wider area. However, existing ODISR methods have limited sampling ranges and feature extraction capabilities, which hinder their ability to capture distorted patterns over large areas. To address this issue, we propose a novel Multi-level Distortion-aware Deformable Network (MDDN) for ODISR, designed to expand the sampling range and receptive field. Specifically, the feature extractor in MDDN comprises three parallel branches: a deformable attention mechanism (serving as the dilation=1 path) and two dilated deformable convolutions with dilation rates of 2 and 3. This architecture expands the sampling range to include more distorted patterns across wider areas, generating dense and comprehensive features that effectively capture geometric distortions in ERP images. The representations extracted from these deformable feature extractors are adaptively fused in a multi-level feature fusion module. Furthermore, to reduce computational cost, a low-rank decomposition strategy is applied to dilated deformable convolutions. Extensive experiments on publicly available datasets demonstrate that MDDN outperforms state-of-the-art methods, underscoring its effectiveness and superiority in ODISR.
- Abstract(参考訳): 拡張現実や仮想現実が普及するにつれて、OmniDirectional Images(ODI)の画像処理が注目されている。
OmniDirectional Image Super-Resolution (ODISR)は、ODIの視覚的品質を高めるための有望な技術である。
超解像を行う前に、ODIは通常、球面からEquiRectular Projection (ERP) を用いて平面に投影される。
このプロジェクションは、赤道付近での歪みは最小限であるが、より広い領域で画像内容が伸びる極に向かって深刻になる。
しかし、既存のODISR法はサンプリング範囲や特徴抽出能力が限られており、広い領域にわたる歪みパターンの捕捉を妨げている。
この問題に対処するために,ODISRのための新しいMDDN(Multi-level Distortion-aware Deformable Network)を提案する。
具体的には、MDDNの特徴抽出器は、変形可能な注意機構(拡張=1経路として機能する)と2および3の拡散速度を有する2つの拡張可能な変形可能な畳み込みからなる。
このアーキテクチャはサンプリング範囲を拡張し、より広い領域にわたって歪んだパターンを含み、ERP画像の幾何学的歪みを効果的に捉えた密集した包括的特徴を生成する。
これらの変形可能な特徴抽出器から抽出された表現は、多レベル特徴融合モジュールに適応的に融合される。
さらに、計算コストを削減するために、拡張変形可能な畳み込みに対して低ランク分解戦略を適用する。
公開されているデータセットに対する大規模な実験により、MDDNは最先端の手法よりも優れており、ODISRの有効性と優位性を裏付けている。
関連論文リスト
- Deep learning EPI-TIRF cross-modality enables background subtraction and axial super-resolution for widefield fluorescence microscopy [22.180941479385755]
深層学習に基づくEPI-TIRFクロスモダリティネットワークET2dNetを開発し,TIRF対応のバックグラウンドサブトラクションと軸超解像を実現する。
また,成果物を再現する専用3次元再構成ネットワークET3dNetを開発した。
論文 参考訳(メタデータ) (2025-11-10T08:52:56Z) - High-resolution Photo Enhancement in Real-time: A Laplacian Pyramid Network [73.19214585791268]
本稿では,LLF-LUT++と呼ばれるピラミッドネットワークについて紹介する。
具体的には,ダウンサンプリング画像のグローバル音節特性を活かした画像適応型3D LUTを利用する。
LLF-LUT++は、HDR+データセット上でPSNRが2.64dB改善されただけでなく、4K解像度の画像を1つのGPUでわずか13msで処理することで、さらに削減されている。
論文 参考訳(メタデータ) (2025-10-13T16:52:32Z) - Double-Shot 3D Shape Measurement with a Dual-Branch Network for Structured Light Projection Profilometry [14.749887303860717]
我々は、異なる構造光(SL)変調を処理するために、デュアルブランチ畳み込みニューラルネットワーク(CNN)-トランスフォーマーネットワーク(PDCNet)を提案する。
PDCNet内では、Transformerブランチを使用してフリンジイメージのグローバルな認識をキャプチャし、CNNブランチはスペックルイメージのローカル詳細を収集するように設計されている。
提案手法は, 自己生成データセット上で高精度な結果が得られる一方で, フランジオーダーの曖昧さを低減できる。
論文 参考訳(メタデータ) (2024-07-19T10:49:26Z) - Geometric Distortion Guided Transformer for Omnidirectional Image Super-Resolution [26.819508321968108]
GDGT-OSR (Geometric Distortion Guided Transformer for Omdirectional Image Super-Resolution) について紹介する。
具体的には、変形可能な自己アテンションと統合された歪変調矩形ウィンドウ自己アテンション機構を提案し、歪みをよりよく知覚する。
新たなGDGT-OSRは既存の文献の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-16T09:38:33Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - Physics-Inspired Degradation Models for Hyperspectral Image Fusion [61.743696362028246]
ほとんどの融合法は、融合アルゴリズム自体にのみ焦点をあて、分解モデルを見落としている。
我々は、LR-HSIとHR-MSIの劣化をモデル化するための物理インスパイアされた劣化モデル(PIDM)を提案する。
提案したPIDMは,既存の核融合法における核融合性能を向上させることができる。
論文 参考訳(メタデータ) (2024-02-04T09:07:28Z) - PC-GANs: Progressive Compensation Generative Adversarial Networks for
Pan-sharpening [50.943080184828524]
空間情報とスペクトル情報の漸進的補償によりMS画像のシャープ化を行うパンシャーピングの新しい2段階モデルを提案する。
モデル全体が三重GANで構成されており、特定のアーキテクチャに基づいて、三重GANを同時に訓練できるように、共同補償損失関数が設計されている。
論文 参考訳(メタデータ) (2022-07-29T03:09:21Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。