論文の概要: Learning Spatially Collaged Fourier Bases for Implicit Neural
Representation
- arxiv url: http://arxiv.org/abs/2312.17018v1
- Date: Thu, 28 Dec 2023 13:36:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 16:11:21.618917
- Title: Learning Spatially Collaged Fourier Bases for Implicit Neural
Representation
- Title(参考訳): 入射ニューラル表現のための空間的コラージュされたフーリエ基底の学習
- Authors: Jason Chun Lok Li, Chang Liu, Binxiao Huang and Ngai Wong
- Abstract要約: 本稿では,各領域に異なるフーリエ基底を配置する学習可能な空間マスクを提案する。
これはフーリエパッチを照合し、複雑な信号の正確な表現を可能にする。
提案手法は,3dB以上の画像適合PSNRを改良し,98.81 IoUと0.0011 Chamfer Distanceに3D再構成した。
- 参考スコア(独自算出の注目度): 8.908709108907175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing approaches to Implicit Neural Representation (INR) can be
interpreted as a global scene representation via a linear combination of
Fourier bases of different frequencies. However, such universal basis functions
can limit the representation capability in local regions where a specific
component is unnecessary, resulting in unpleasant artifacts. To this end, we
introduce a learnable spatial mask that effectively dispatches distinct Fourier
bases into respective regions. This translates into collaging Fourier patches,
thus enabling an accurate representation of complex signals. Comprehensive
experiments demonstrate the superior reconstruction quality of the proposed
approach over existing baselines across various INR tasks, including image
fitting, video representation, and 3D shape representation. Our method
outperforms all other baselines, improving the image fitting PSNR by over 3dB
and 3D reconstruction to 98.81 IoU and 0.0011 Chamfer Distance.
- Abstract(参考訳): Inlicit Neural Representation (INR) への既存のアプローチは、異なる周波数のフーリエ基底の線形結合による大域的なシーン表現として解釈できる。
しかし、そのような普遍基底関数は特定の成分が不要な局所領域における表現能力を制限することができ、不愉快なアーティファクトをもたらす。
この目的のために,各領域に異なるフーリエ基底を効果的にディスパッチする学習可能な空間マスクを導入する。
これはフーリエパッチを照合し、複雑な信号の正確な表現を可能にする。
包括的実験により,画像の嵌合,映像の表現,3次元形状の表現など,既存のINRタスクのベースラインよりも優れた再現性を示す。
提案手法は,3dB以上の画像適合PSNRを改良し,98.81 IoUと0.0011 Chamfer Distanceに3D再構成した。
関連論文リスト
- Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks [4.499833362998488]
入射神経表現(INR)は、複雑な信号の連続的および分解非依存的な表現を提供するためにニューラルネットワークを使用する。
提案したFKANは、第1層のフーリエ級数としてモデル化された学習可能なアクティベーション関数を用いて、タスク固有の周波数成分を効果的に制御し、学習する。
実験結果から,提案したFKANモデルは,最先端の3つのベースラインスキームよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-09-14T05:53:33Z) - MuRF: Multi-Baseline Radiance Fields [117.55811938988256]
スパースビュー合成におけるフィードフォワードアプローチであるmulti-Baseline Radiance Fields(MuRF)を提案する。
MuRFは、複数の異なるベースライン設定で最先端のパフォーマンスを達成する。
また、Mip-NeRF 360データセット上でゼロショットの一般化能力を示す。
論文 参考訳(メタデータ) (2023-12-07T18:59:56Z) - Multiscale Representation for Real-Time Anti-Aliasing Neural Rendering [84.37776381343662]
Mip-NeRFは、スケール情報をエンコードする円錐フラストラムとしてマルチスケール表現を提案する。
我々は,リアルタイムなアンチエイリアスレンダリングのためのマルチスケールな明示的表現であるmip voxel grids (Mip-VoG)を提案する。
私たちのアプローチは、マルチスケールのトレーニングとリアルタイムのアンチエイリアスレンダリングを同時に提供する最初の方法です。
論文 参考訳(メタデータ) (2023-04-20T04:05:22Z) - Tetra-NeRF: Representing Neural Radiance Fields Using Tetrahedra [31.654710376807593]
本稿では,一様部分分割や点ベース表現の代わりに,デラウネーによって得られるテトラヘドラに基づく適応表現を用いることを提案する。
このような表現が効率的なトレーニングを可能にし、最先端の成果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-04-19T21:44:27Z) - Semantic 3D-aware Portrait Synthesis and Manipulation Based on
Compositional Neural Radiance Field [55.431697263581626]
セマンティックな3次元画像合成と操作のための合成ニューラルネットワーク場(CNeRF)を提案する。
CNeRFは、イメージを意味領域に分割し、各領域の独立した神経放射場を学び、最終的にそれらを融合し、完全な画像をレンダリングする。
最先端の3D-Aware GAN法と比較して,我々は高品質な3D一貫性合成を維持しつつ,きめ細かな意味領域操作を可能にする。
論文 参考訳(メタデータ) (2023-02-03T07:17:46Z) - Factor Fields: A Unified Framework for Neural Fields and Beyond [50.29013417187368]
本稿では、信号のモデリングと表現のための新しいフレームワークであるFacter Fieldsを紹介する。
我々のフレームワークは、NeRF、Plenoxels、EG3D、Instant-NGP、TensoRFなどの最近の信号表現に対応している。
この表現は,2次元画像回帰作業における画像の近似精度の向上,3次元符号付き距離場再構築時の幾何学的品質の向上,および放射場再構成作業におけるコンパクト性の向上を実現している。
論文 参考訳(メタデータ) (2023-02-02T17:06:50Z) - Deep Fourier Up-Sampling [100.59885545206744]
フーリエ領域のアップサンプリングは、そのような局所的な性質に従わないため、より難しい。
これらの問題を解決するために理論的に健全なDeep Fourier Up-Sampling (FourierUp)を提案する。
論文 参考訳(メタデータ) (2022-10-11T06:17:31Z) - Vision Transformer for NeRF-Based View Synthesis from a Single Input
Image [49.956005709863355]
本稿では,グローバルな特徴と局所的な特徴を両立させ,表現力のある3D表現を実現することを提案する。
新たなビューを合成するために,学習した3次元表現に条件付き多層パーセプトロン(MLP)ネットワークを訓練し,ボリュームレンダリングを行う。
提案手法は,1つの入力画像のみから新しいビューを描画し,複数のオブジェクトカテゴリを1つのモデルで一般化することができる。
論文 参考訳(メタデータ) (2022-07-12T17:52:04Z) - Learning Local Implicit Fourier Representation for Image Warping [11.526109213908091]
画像ワーピング(LTEW)のための局所的テクスチャ推定器を提案し,次に暗黙のニューラル表現を用いて画像を連続的な形状に変形する。
我々のLTEWベースのニューラル関数は、非対称スケールSRとホモグラフィ変換の既存のワープ手法よりも優れています。
論文 参考訳(メタデータ) (2022-07-05T06:30:17Z) - Seeing Implicit Neural Representations as Fourier Series [13.216389226310987]
Inlicit Neural Representation (INR)は低次元問題領域における高周波関数を表現するために多層パーセプトロンを使用する。
これらの表現は、複雑な3Dオブジェクトやシーンに関連するタスクについて、最先端の結果を得た。
この研究は2つの方法間の接続を分析し、フーリエ写像されたパーセプトロンが構造的に1つの隠蔽層SIRENと似ていることを示す。
論文 参考訳(メタデータ) (2021-09-01T08:40:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。