論文の概要: SuperF: Neural Implicit Fields for Multi-Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2512.09115v1
- Date: Tue, 09 Dec 2025 20:57:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.320995
- Title: SuperF: Neural Implicit Fields for Multi-Image Super-Resolution
- Title(参考訳): SuperF: マルチイメージ超解像のためのニューラルインシシシト場
- Authors: Sander Riisøen Jyhne, Christian Igel, Morten Goodwin, Per-Arne Andersen, Serge Belongie, Nico Lang,
- Abstract要約: SuperFはマルチイメージ・スーパーレゾリューション(MISR)のためのテスト時間最適化手法である
我々の実験は、ハンドヘルドカメラによる衛星画像と地上レベルの画像の模擬バーストについて、説得力のある結果をもたらす。
- 参考スコア(独自算出の注目度): 15.679463301639329
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-resolution imagery is often hindered by limitations in sensor technology, atmospheric conditions, and costs. Such challenges occur in satellite remote sensing, but also with handheld cameras, such as our smartphones. Hence, super-resolution aims to enhance the image resolution algorithmically. Since single-image super-resolution requires solving an inverse problem, such methods must exploit strong priors, e.g. learned from high-resolution training data, or be constrained by auxiliary data, e.g. by a high-resolution guide from another modality. While qualitatively pleasing, such approaches often lead to "hallucinated" structures that do not match reality. In contrast, multi-image super-resolution (MISR) aims to improve the (optical) resolution by constraining the super-resolution process with multiple views taken with sub-pixel shifts. Here, we propose SuperF, a test-time optimization approach for MISR that leverages coordinate-based neural networks, also called neural fields. Their ability to represent continuous signals with an implicit neural representation (INR) makes them an ideal fit for the MISR task. The key characteristic of our approach is to share an INR for multiple shifted low-resolution frames and to jointly optimize the frame alignment with the INR. Our approach advances related INR baselines, adopted from burst fusion for layer separation, by directly parameterizing the sub-pixel alignment as optimizable affine transformation parameters and by optimizing via a super-sampled coordinate grid that corresponds to the output resolution. Our experiments yield compelling results on simulated bursts of satellite imagery and ground-level images from handheld cameras, with upsampling factors of up to 8. A key advantage of SuperF is that this approach does not rely on any high-resolution training data.
- Abstract(参考訳): 高解像度画像は、センサー技術、大気条件、コストの制限によってしばしば妨げられる。
このような課題は、衛星リモートセンシングだけでなく、スマートフォンなどのハンドヘルドカメラでも起こります。
したがって、超解像は画像分解能をアルゴリズムで強化することを目的としている。
シングルイメージの超解像は逆問題の解法を必要とするため、そのような手法は、例えば高解像度のトレーニングデータから学んだり、補助データによって制約されたり、例えば、他のモードからの高解像度のガイドによって、強い事前情報を利用する必要がある。
質的に喜ぶ一方で、そのようなアプローチは現実に合わない「ハロゲン化」構造につながることが多い。
対照的に、マルチイメージ・スーパーレゾリューション(MISR)は、サブピクセルシフトによる複数のビューで超解像度プロセスを制約することで、(光学)レゾリューションを改善することを目的としている。
本稿では、座標ベースニューラルネットワーク(ニューラルフィールド)を利用したMISRのテスト時間最適化手法であるSuperFを提案する。
暗黙的なニューラル表現(INR)で連続信号を表現する能力は、MISRタスクに適している。
提案手法の鍵となる特徴は、複数のシフトした低解像度フレームに対してINRを共有することと、INRとのフレームアライメントを協調的に最適化することである。
本手法は, サブピクセルアライメントを最適化可能なアフィン変換パラメータとして直接パラメータ化し, 出力解像度に対応する超サンプリング座標格子を用いて最適化することにより, 層分離のためのバースト融合から適用したINRベースラインを推し進める。
実験の結果,ハンドヘルドカメラによる衛星画像と地上画像の模擬バーストについて,最大8。
SuperFの重要な利点は、このアプローチが高解像度のトレーニングデータに依存していないことである。
関連論文リスト
- Pixel to Gaussian: Ultra-Fast Continuous Super-Resolution with 2D Gaussian Modeling [50.34513854725803]
Arbitrary-scale Super- resolution (ASSR) は、低解像度(LR)入力から任意のアップサンプリング係数で高解像度(HR)イメージを再構成することを目的としている。
本稿では,Gaussian Splattingを用いたLR画像から2次元連続HR信号を明示的に再構成する,Pixel-to-Gaussianパラダイムを用いた新しいContinuousSRフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-09T13:43:57Z) - Learning Two-factor Representation for Magnetic Resonance Image Super-resolution [1.294284364022674]
2要素表現に基づくMR画像超解像法を提案する。
具体的には、強度信号を学習可能な基底と係数の線形結合に分解する。
提案手法は最先端の性能を達成し,より優れた視覚的忠実度とロバスト性を実現する。
論文 参考訳(メタデータ) (2024-09-15T13:32:24Z) - Balancing Efficiency and Quality: MoEISR for Arbitrary-Scale Image Super-Resolution [11.256166497045792]
我々は、新しい効率的なフレームワーク、Mixture-of-Experts Implicit Super-Resolution(MoEISR)を紹介する。
MoEISRは、軽量マッパーモジュールを使用して、最も適切なデコードの専門家を各ピクセルに動的に割り当てる。
実験により,MoEISRはピーク信号対雑音比 (PSNR) と同等あるいは優れたピーク信号対雑音比 (PSNR) を提供しながら,大量の浮動小数点演算 (FLOPs) を効果的に低減できることを示した。
論文 参考訳(メタデータ) (2023-11-20T05:34:36Z) - Spatially-Adaptive Feature Modulation for Efficient Image
Super-Resolution [90.16462805389943]
視覚変換器(ViT)のようなブロック上に,空間適応型特徴変調(SAFM)機構を開発する。
提案法は最先端のSR法よりも3倍程度小さい。
論文 参考訳(メタデータ) (2023-02-27T14:19:31Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Fusformer: A Transformer-based Fusion Approach for Hyperspectral Image
Super-resolution [9.022005574190182]
低分解能ハイパースペクトル像と高分解能マルチスペクトル像を融合させるトランスフォーマーに基づくネットワークを設計する。
LR-HSIは主スペクトル構造を持つため、ネットワークは空間的詳細推定に重点を置いている。
様々な実験と品質指標は、他の最先端手法と比較して、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2021-09-05T14:00:34Z) - Boosting Image Super-Resolution Via Fusion of Complementary Information
Captured by Multi-Modal Sensors [21.264746234523678]
イメージスーパーレゾリューション(sr)は、低解像度光センサの画質を向上させる有望な技術である。
本稿では,安価なチャネル(可視・深度)からの補完情報を活用して,少ないパラメータを用いて高価なチャネル(熱)の画像品質を向上させる。
論文 参考訳(メタデータ) (2020-12-07T02:15:28Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z) - Deep Generative Adversarial Residual Convolutional Networks for
Real-World Super-Resolution [31.934084942626257]
我々は,超解像残差畳み込み生成共役ネットワーク(SRResCGAN)を提案する。
これは、生成したLRドメインからHRドメインの画素単位の監督でモデルを逆トレーニングすることで、現実世界の劣化設定に従う。
提案するネットワークは,画像の高精細化と凸最適化によるエネルギーベース目的関数の最小化により,残差学習を利用する。
論文 参考訳(メタデータ) (2020-05-03T00:12:38Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Video Face Super-Resolution with Motion-Adaptive Feedback Cell [90.73821618795512]
深部畳み込みニューラルネットワーク(CNN)の発展により,ビデオ超解像法(VSR)は近年,顕著な成功を収めている。
本稿では,動作補償を効率的に捕捉し,適応的にネットワークにフィードバックする,シンプルで効果的なブロックである動き適応型フィードバックセル(MAFC)を提案する。
論文 参考訳(メタデータ) (2020-02-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。