論文の概要: GB-LSR: A Fast Local Spectral Image Representation with a Single Global Bandwidth for Continuous Reconstruction and Super-Resolution
- arxiv url: http://arxiv.org/abs/2606.19617v1
- Date: Wed, 17 Jun 2026 21:50:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.551948
- Title: GB-LSR: A Fast Local Spectral Image Representation with a Single Global Bandwidth for Continuous Reconstruction and Super-Resolution
- Title(参考訳): GB-LSR : 連続再構成と超解像のための単一グローバル帯域を用いた高速局所スペクトル画像表現
- Authors: Max Shad, Naeem Khoshnevis,
- Abstract要約: 連続画像再構成のための固定格子型局所スペクトル表現であるGB-LSRを提案する。
トレーニング可能なグローバルスカラー(main)、固定されたグローバルスカラー、パッチ単位の帯域幅フィールドの3つの帯域幅処理変種について検討する。
主な派生型は2.8-3.6 dB PSNRと0.11-0.15 LPIPSによるLIIF / LTE / WIREの再実装である。
別の任意のスケールの超解像(ASR)拡張では、GB-LSRは標準型SRプロトコルの下で競合するPSNR-Yを達成する。
- 参考スコア(独自算出の注目度): 0.6138671548064355
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present GB-LSR (Global-Bandwidth Local Spectral Representation), a fixed-grid local spectral representation for continuous image reconstruction. The image domain is partitioned into non-overlapping square patches, each carrying coefficients for a truncated Fourier basis predicted from shared convolutional-encoder features. A single trainable scalar bandwidth is shared globally across all patches and images, and reconstruction at any continuous coordinate is a fixed-size basis contraction whose cost is independent of image size. We study three bandwidth-handling variants: a trainable global scalar (main), a fixed global scalar, and a per-patch bandwidth field. On a standardized native-reconstruction benchmark across Kodak, Set14, and Urban100, the main variant outperforms matched-budget amortized LIIF / LTE / WIRE re-implementations by 2.8-3.6 dB PSNR and 0.11-0.15 LPIPS, while running at roughly one-quarter of the slowest baseline's inference cost. The single global scalar suffices empirically: per-patch adaptive-bandwidth alternatives do not improve over it on either a closed-form locality diagnostic or an end-to-end ablation. In a separate arbitrary-scale super-resolution (ASR) extension, GB-LSR achieves competitive PSNR-Y under a canonical-style SR protocol and runs 1.44x faster than LIIF-RDN and 3.25x faster than LTE-SwinIR at x4; within the same extension, a variant trained and evaluated without 4-corner local-ensemble averaging gives a 1.77x speedup with 35% lower peak memory and negligible PSNR change, while additionally widening the RDN encoder from 64 to 96 channels gives a small positive PSNR shift with a 1.58x speedup and 31% lower peak memory. Native-reconstruction claims are scoped to the matched-budget amortized protocol, and ASR claims are scoped to a separate canonical-style SR protocol.
- Abstract(参考訳): 連続画像再構成のための固定格子型局所スペクトル表現であるGB-LSR(Global-Bandwidth Local Spectral Representation)を提案する。
画像領域を重複しない正方形パッチに分割し、共有畳み込みエンコーダ特徴から予測される切り離されたフーリエ基底の搬送係数を算出する。
単一のトレーニング可能なスカラー帯域幅は、すべてのパッチとイメージでグローバルに共有され、任意の連続座標における再構成は、コストが画像サイズに依存しない固定サイズベース収縮である。
トレーニング可能なグローバルスカラー(main)、固定されたグローバルスカラー、パッチ単位の帯域幅フィールドの3つの帯域幅処理変種について検討する。
Kodak、Set14、Urban100にまたがる標準化されたネイティブ・リコンストラクション・ベンチマークでは、主要な派生型はLIIF / LTE / WIREを2.8-3.6 dB PSNRと0.11-0.15 LPIPSで再実装し、最も遅いベースラインの推論コストの約4分の1で実行している。
単一グローバルスカラーは経験的に十分である: パッチごとの適応帯域幅の代替手段は、クローズドフォームの局所性診断やエンドツーエンドのアブレーションでは改善しない。
別の任意のスケールの超解像(ASR)拡張では、GB-LSRは標準型SRプロトコルの下で競合するPSNR-Yを達成し、LIIF-RDNよりも1.44倍高速で、x4ではLTE-SwinIRより3.25倍高速である。
ネイティブリコンストラクションのクレームは一致した予算削減プロトコルにスコープされ、ASRのクレームは別の標準スタイルのSRプロトコルにスコープされる。
関連論文リスト
- Scaling Parallel Sequence Models to Foundation-Scale Vision Encoders [123.58723804218151]
ビジョンファウンデーションモデルは、自己注意の二次的なコストによってボトルネックとなる。
2次元空間伝搬伝搬に基づくC-GSPNを提案する。
論文 参考訳(メタデータ) (2026-05-30T14:29:43Z) - CAFlow: Adaptive-Depth Single-Step Flow Matching for Efficient Histopathology Super-Resolution [0.0]
全スライディング画像は、通常、ギガピクセルの解像度を超えるため、計算集約的な生成超解像は、日常的な展開には不実用である。
適応的な1ステップフローマッチングフレームワークであるCAFlowを導入し,各画像タイルを最も浅いネットワーク出口にルーティングする。
多臓器の病理組織学的 x4 SR では、適応的ルーティングは完全な深さで 31.72 dB PSNR と 31.84 dB を達成し、最も浅い出口は SwinIR-light よりも2.8倍少ない計算で +1.9 dB を超える。
論文 参考訳(メタデータ) (2026-03-19T05:45:58Z) - Position-Aware Scene-Appearance Disentanglement for Bidirectional Photoacoustic Microscopy Registration [6.677604052097574]
光分解能高速光顕微鏡(OR-PAM)
既存の登録法は、輝度コンスタント性仮定に制約され、アライメント品質が制限されている。
GPEReg-Netは、ドメイン固有の外見コードとドメイン固有の外見的特徴を分離する、シーン・外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的外見的特徴を分離するフレームワークである。
OR-PAM-Reg-4Kベンチマークでは、GPEReg-Netが0.953、0.932、PSNRが34.49dB、SSIMが3.8%、SSIMが1.99dBを突破した。
論文 参考訳(メタデータ) (2026-02-17T19:20:23Z) - Progressive Contrast Registration for High-Fidelity Bidirectional Photoacoustic Microscopy Alignment [1.1597621848542221]
PCReg-Netは、粗い粒度アライメントを実行するプログレッシブコントラスト誘導型登録フレームワークである。
OR-PAM-Reg-4K (432 試験サンプル)では、PCReg-Net は NCC 0.983、SSIM 0.982、PSNR 46.96 dB を達成する。
論文 参考訳(メタデータ) (2026-02-09T19:33:38Z) - One Small Step in Latent, One Giant Leap for Pixels: Fast Latent Upscale Adapter for Your Diffusion Models [45.92038137978053]
本稿では,Latent Upscaler Adapter(LUA)について述べる。
LUAはドロップインコンポーネントとして統合されており、ベースモデルや追加の拡散段階を変更する必要はない。
スケール固有のピクセルシャッフルヘッドを持つ共有Swinスタイルのバックボーンは、2xと4xファクタをサポートし、画像空間SRベースラインと互換性がある。
論文 参考訳(メタデータ) (2025-11-13T18:54:18Z) - Speedy MASt3R [68.47052557089631]
MASt3Rは、DUSt3Rを活用して高速な相互マッチング方式を導入することで、画像マッチングを3Dタスクとして再定義する。
高速MASt3Rは、精度を犠牲にすることなく、推論時間(画像ペアあたり198msから91ms)を54%削減する。
この進歩により、リアルタイムな3D理解が可能になり、複合現実ナビゲーションや大規模3Dシーン再構築といったアプリケーションに恩恵をもたらす。
論文 参考訳(メタデータ) (2025-03-13T03:56:22Z) - Self-Gated Memory Recurrent Network for Efficient Scalable HDR
Deghosting [59.04604001936661]
本稿では,任意の長さの動的シーケンスを浮き彫りにする新しいネットワーク型HDRデゴースト法を提案する。
本稿では,SGM(Self-Gated Memory)セルという新たなリカレントセルアーキテクチャを導入する。
提案手法は,既存の3つの公開データセットを定量的に比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-12-24T12:36:33Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - Cross-Scale Internal Graph Neural Network for Image Super-Resolution [147.77050877373674]
自然画像における非局所的な自己相似性は、画像修復に有効な先行研究として、よく研究されている。
単一の画像超解像(SISR)の場合、既存のディープ非局所法のほとんどは、低解像度(LR)入力画像と同じ規模のパッチしか利用していない。
これは、新しいクロススケールな内部グラフニューラルネットワーク(IGNN)を用いて実現される。
論文 参考訳(メタデータ) (2020-06-30T10:48:40Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。