論文の概要: High-Frequency First: A Two-Stage Approach for Improving Image INR
- arxiv url: http://arxiv.org/abs/2508.15582v2
- Date: Fri, 22 Aug 2025 08:30:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 12:20:05.413288
- Title: High-Frequency First: A Two-Stage Approach for Improving Image INR
- Title(参考訳): 高周波ファースト:画像INR改善のための2段階アプローチ
- Authors: Sumit Kumar Dam, Mrityunjoy Gain, Eui-Nam Huh, Choong Seon Hong,
- Abstract要約: Implicit Neural Representations (INR) は、従来のピクセルベースのフォーマットに代わる強力な代替手段として登場した。
重要な課題は、ニューラルネットワークのスペクトルバイアスであり、高周波の詳細を捉えるのに苦労しながら、低周波成分を好む傾向がある。
隣接するソフトマスクは,局所的な変化が強い画素に対して,高い重みを適応的に割り当てる2段階のトレーニング戦略を導入する。
- 参考スコア(独自算出の注目度): 13.070432644808806
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Implicit Neural Representations (INRs) have emerged as a powerful alternative to traditional pixel-based formats by modeling images as continuous functions over spatial coordinates. A key challenge, however, lies in the spectral bias of neural networks, which tend to favor low-frequency components while struggling to capture high-frequency (HF) details such as sharp edges and fine textures. While prior approaches have addressed this limitation through architectural modifications or specialized activation functions, we propose an orthogonal direction by directly guiding the training process. Specifically, we introduce a two-stage training strategy where a neighbor-aware soft mask adaptively assigns higher weights to pixels with strong local variations, encouraging early focus on fine details. The model then transitions to full-image training. Experimental results show that our approach consistently improves reconstruction quality and complements existing INR methods. As a pioneering attempt to assign frequency-aware importance to pixels in image INR, our work offers a new avenue for mitigating the spectral bias problem.
- Abstract(参考訳): Inlicit Neural Representations (INR)は、画像を空間座標上の連続関数としてモデル化することで、従来のピクセルベースのフォーマットに代わる強力な代替手段として登場した。
しかし、重要な課題は、ニューラルネットワークのスペクトルバイアスであり、鋭いエッジやきめ細かいテクスチャといった高周波(HF)の詳細を捉えるのに苦労しながら、低周波成分を好む傾向がある。
事前のアプローチでは、アーキテクチャの変更や特別なアクティベーション機能を通じてこの制限に対処しているが、トレーニングプロセスを直接導くことによって直交方向を提案する。
具体的には,隣接するソフトマスクが局所的変化の強い画素に高い重みを適応的に割り当て,詳細を早期に重視する2段階のトレーニング戦略を提案する。
その後、モデルはフルイメージのトレーニングへと移行する。
実験の結果,提案手法は再建品質を継続的に改善し,既存のINR法を補完することがわかった。
画像INRの画素に周波数認識の重要性を割り当てる先駆的な試みとして、我々の研究はスペクトルバイアス問題を緩和するための新たな道筋を提供する。
関連論文リスト
- Learning Multi-scale Spatial-frequency Features for Image Denoising [58.883244886588336]
本稿では,マルチスケール適応型デュアルドメインネットワーク(MADNet)を提案する。
画像ピラミッド入力を用いて低解像度画像からノイズのない結果を復元する。
高周波情報と低周波情報の相互作用を実現するために,適応型空間周波数学習ユニットを設計する。
論文 参考訳(メタデータ) (2025-06-19T13:28:09Z) - FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - Super-temporal-resolution Photoacoustic Imaging with Dynamic Reconstruction through Implicit Neural Representation in Sparse-view [4.333674832664625]
Inlicit Neural Representation (INR)は、スパースデータによる逆問題解決のための強力なディープラーニングツールとして登場した。
本研究では、スパースビューからの動的光音響画像再構成を改善するためのINRに基づく手法を提案する。
提案したINRは、動的光音響画像を暗黙の関数として表現し、それらをニューラルネットワークにエンコードする。
論文 参考訳(メタデータ) (2025-05-29T06:36:44Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - Enhanced Low-Dose CT Image Reconstruction by Domain and Task Shifting Gaussian Denoisers [3.4748713192043876]
低放射線線量 (LDCT) からのCTは, 投射データに高ノイズが伴うため困難である。
本稿では,2段階の手法と最先端の再現性を組み合わせた簡易性と効率性を提案する。
論文 参考訳(メタデータ) (2024-03-06T08:51:09Z) - Informative Rays Selection for Few-Shot Neural Radiance Fields [0.3599866690398789]
KeyNeRFは、重要な情報線に着目して、数ショットのシナリオでNeRFを訓練するための、シンプルで効果的な方法である。
提案手法は,既存のNeRFの最小限の変更を必要としながら,最先端の手法に対して良好に機能する。
論文 参考訳(メタデータ) (2023-12-29T11:08:19Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。