論文の概要: NSTR: Neural Spectral Transport Representation for Space-Varying Frequency Fields
- arxiv url: http://arxiv.org/abs/2511.18384v1
- Date: Sun, 23 Nov 2025 10:24:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.813105
- Title: NSTR: Neural Spectral Transport Representation for Space-Varying Frequency Fields
- Title(参考訳): NSTR: 空間変動周波数場のためのニューラルスペクトル輸送表現
- Authors: Plein Versace,
- Abstract要約: Inlicit Neural Representations (INR)は、画像、オーディオ、三次元シーンなどの信号を表現するための強力なパラダイムとして登場した。
我々は,空間的に変化する局所周波数場を可視化する最初のINRフレームワークであるtextbfNeural Spectral Transport Representation (NSTR)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Implicit Neural Representations (INRs) have emerged as a powerful paradigm for representing signals such as images, audio, and 3D scenes. However, existing INR frameworks -- including MLPs with Fourier features, SIREN, and multiresolution hash grids -- implicitly assume a \textit{global and stationary} spectral basis. This assumption is fundamentally misaligned with real-world signals whose frequency characteristics vary significantly across space, exhibiting local high-frequency textures, smooth regions, and frequency drift phenomena. We propose \textbf{Neural Spectral Transport Representation (NSTR)}, the first INR framework that \textbf{explicitly models a spatially varying local frequency field}. NSTR introduces a learnable \emph{frequency transport equation}, a PDE that governs how local spectral compositions evolve across space. Given a learnable local spectrum field $S(x)$ and a frequency transport network $F_θ$ enforcing $\nabla S(x) \approx F_θ(x, S(x))$, NSTR reconstructs signals by spatially modulating a compact set of global sinusoidal bases. This formulation enables strong local adaptivity and offers a new level of interpretability via visualizing frequency flows. Experiments on 2D image regression, audio reconstruction, and implicit 3D geometry show that NSTR achieves significantly better accuracy-parameter trade-offs than SIREN, Fourier-feature MLPs, and Instant-NGP. NSTR requires fewer global frequencies, converges faster, and naturally explains signal structure through spectral transport fields. We believe NSTR opens a new direction in INR research by introducing explicit modeling of space-varying spectrum.
- Abstract(参考訳): Inlicit Neural Representations (INR)は、画像、オーディオ、三次元シーンなどの信号を表現するための強力なパラダイムとして登場した。
しかし、既存のINRフレームワーク(フーリエ機能、SIREN、マルチレゾリューションハッシュグリッドを含む)は、暗黙的に \textit{global and stationary} スペクトルベースを仮定している。
この仮定は、局所的な高周波テクスチャ、滑らかな領域、周波数ドリフト現象などの周波数特性が空間によって大きく異なる実世界の信号と基本的には一致していない。
我々は,空間的に変化する局所周波数場をモデル化した最初のINRフレームワークである, {textbf{Neural Spectral Transport Representation (NSTR)} を提案する。
NSTRは、局所的なスペクトル合成が空間にわたってどのように進化するかを管理するPDEである学習可能な 'emph{ frequency transport equation} を導入している。
学習可能な局所スペクトル場$S(x)$と周波数輸送ネットワーク$F_θ$を$\nabla S(x) \approx F_θ(x, S(x))$とすると、NSTRはグローバル正弦波基底のコンパクトな集合を空間的に変調して信号を再構成する。
この定式化は、強い局所適応性を可能にし、周波数フローを可視化することで、新しいレベルの解釈性を提供する。
2次元画像回帰、音声再構成、暗黙的な3次元幾何学の実験により、NSTRはSIREN, Fourier-Feature MLP, Instant-NGPよりも精度とパラメータのトレードオフが大幅に向上した。
NSTRは、より少ない大域周波数を必要とし、より速く収束し、スペクトル輸送場を通して信号構造を自然に説明する。
我々は、NSTRが空間変化スペクトルの明示的なモデリングを導入することにより、INR研究の新たな方向性を開くと信じている。
関連論文リスト
- Scaling Implicit Fields via Hypernetwork-Driven Multiscale Coordinate Transformations [0.0]
Inlicit Neural Representations (INR)は、画像、3次元形状、符号付き距離場、放射場などの信号を表現するための強力なパラダイムとして登場した。
この研究は、ハイパーネットワークを用いて信号適応座標変換を学習することにより、表現ボトルネックを破る新しいINRのクラスであるHyper-Coordinate Implicit Neural Representations (HC-INR)を導入している。
論文 参考訳(メタデータ) (2025-11-23T10:27:04Z) - FLAIR: Frequency- and Locality-Aware Implicit Neural Representations [13.614373731196272]
Implicit Representations (INR) はニューラルネットワークを利用して、座標を対応する信号にマッピングし、連続的かつコンパクトな表現を可能にする。
既存のINRは周波数選択性、空間的局所化、スパース表現に欠けており、冗長な信号成分への過度な依存につながっている。
本稿では2つの重要なイノベーションを取り入れたFLAIR(Frequency- and Locality-Aware Implicit Representations)を提案する。
論文 参考訳(メタデータ) (2025-08-19T06:06:04Z) - Geometric Neural Process Fields [58.77241763774756]
幾何学的ニューラル・プロセス・フィールド(Geometric Neural Process Fields, G-NPF)は、ニューラル・ラディアンス・フィールドの確率的フレームワークである。
これらの基盤の上に構築された階層型潜在変数モデルにより、G-NPFは複数の空間レベルにまたがる構造情報を統合できる。
3次元シーンと2次元画像と1次元信号レグレッションの新規ビュー合成実験により,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-02-04T14:17:18Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Learning Spatially Collaged Fourier Bases for Implicit Neural
Representation [8.908709108907175]
本稿では,各領域に異なるフーリエ基底を配置する学習可能な空間マスクを提案する。
これはフーリエパッチを照合し、複雑な信号の正確な表現を可能にする。
提案手法は,3dB以上の画像適合PSNRを改良し,98.81 IoUと0.0011 Chamfer Distanceに3D再構成した。
論文 参考訳(メタデータ) (2023-12-28T13:36:23Z) - Spectral Enhanced Rectangle Transformer for Hyperspectral Image
Denoising [64.11157141177208]
ハイパースペクトル画像の空間的およびスペクトル的相関をモデル化するスペクトル拡張矩形変換器を提案する。
前者に対しては、長方形自己アテンションを水平および垂直に利用し、空間領域における非局所的類似性を捉える。
後者のために,空間スペクトル立方体の大域的低ランク特性を抽出し,雑音を抑制するスペクトル拡張モジュールを設計する。
論文 参考訳(メタデータ) (2023-04-03T09:42:13Z) - Semi-signed neural fitting for surface reconstruction from unoriented
point clouds [53.379712818791894]
より優れた符号付き距離場を再構成するためのSN-Fittingを提案する。
SSNフィッティングは半署名の監督と損失に基づく領域サンプリング戦略で構成されている。
我々は,SSN-Fittingが,異なる設定下で最先端の性能を達成することを示す実験を行う。
論文 参考訳(メタデータ) (2022-06-14T09:40:17Z) - PINs: Progressive Implicit Networks for Multi-Scale Neural
Representations [68.73195473089324]
周波数符号化のインクリメンタルな集合に階層構造を露出するプログレッシブな位置符号化を提案する。
本モデルでは,広帯域のシーンを正確に再構成し,プログレッシブなディテールでシーン表現を学習する。
いくつかの2次元および3次元データセットの実験では、ベースラインと比較して、再構築精度、表現能力、トレーニング速度が改善されている。
論文 参考訳(メタデータ) (2022-02-09T20:33:37Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。