論文の概要: PET-NeuS: Positional Encoding Tri-Planes for Neural Surfaces
- arxiv url: http://arxiv.org/abs/2305.05594v1
- Date: Tue, 9 May 2023 16:35:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-10 12:12:43.453291
- Title: PET-NeuS: Positional Encoding Tri-Planes for Neural Surfaces
- Title(参考訳): PET-NeuS: ニューラルネットワークのための位置符号化トリプレーン
- Authors: Yiqun Wang, Ivan Skorokhodov, Peter Wonka
- Abstract要約: 我々は、最近成功したNeuS法に基づいて、それを3つの新しいコンポーネントで拡張する。
最初のコンポーネントは、EG3Dから三平面表現を借りることである。
第2のコンポーネントは、学習可能な重み付き新しいタイプの位置符号化を使用することである。
第3のコンポーネントは、自己アテンションを用いて三面体の特徴の学習可能な畳み込み操作を使用して、異なる周波数帯域を持つ特徴を生成することである。
- 参考スコア(独自算出の注目度): 44.73668037810989
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A signed distance function (SDF) parametrized by an MLP is a common
ingredient of neural surface reconstruction. We build on the successful recent
method NeuS to extend it by three new components. The first component is to
borrow the tri-plane representation from EG3D and represent signed distance
fields as a mixture of tri-planes and MLPs instead of representing it with MLPs
only. Using tri-planes leads to a more expressive data structure but will also
introduce noise in the reconstructed surface. The second component is to use a
new type of positional encoding with learnable weights to combat noise in the
reconstruction process. We divide the features in the tri-plane into multiple
frequency scales and modulate them with sin and cos functions of different
frequencies. The third component is to use learnable convolution operations on
the tri-plane features using self-attention convolution to produce features
with different frequency bands. The experiments show that PET-NeuS achieves
high-fidelity surface reconstruction on standard datasets. Following previous
work and using the Chamfer metric as the most important way to measure surface
reconstruction quality, we are able to improve upon the NeuS baseline by 57% on
Nerf-synthetic (0.84 compared to 1.97) and by 15.5% on DTU (0.71 compared to
0.84). The qualitative evaluation reveals how our method can better control the
interference of high-frequency noise. Code available at
\url{https://github.com/yiqun-wang/PET-NeuS}.
- Abstract(参考訳): MLPによってパラメータ化された符号距離関数(SDF)は、神経表面再構成の一般的な要素である。
我々は、最近成功したNeuS法に基づいて、それを3つの新しいコンポーネントで拡張する。
第1の構成要素は、EG3Dから三平面表現を借用し、符号付き距離場を三平面とMLPの混合として表現することである。
三面体を使用すると、より表現力のあるデータ構造になるが、再構成された表面にノイズも生じる。
第2のコンポーネントは、学習可能な重み付き新しいタイプの位置符号化を使用して、再建プロセスにおいてノイズに対処することである。
3次元平面の特徴を複数の周波数スケールに分割し、異なる周波数のsinとcos関数で変調する。
第3のコンポーネントは、自己アテンション畳み込みを用いて三面体の特徴を学習可能な畳み込み操作を使用して、異なる周波数帯域を持つ特徴を生成することである。
実験の結果,PET-NeuSは標準データセット上で高忠実な表面再構成を実現することがわかった。
前回の研究とチャンファー測度を表面再構成の質を測定する最も重要な方法として用いた結果、Nerf-synthetic(0.84対1.97)で57%、DTU(0.71対0.84)で15.5%の改善が達成された。
定性的評価は,高周波ノイズの干渉をよりよく制御する方法を明らかにする。
コードは \url{https://github.com/yiqun-wang/pet-neus}。
関連論文リスト
- Flow Matching for Atmospheric Retrieval of Exoplanets: Where Reliability meets Adaptive Noise Levels [38.84835238599221]
流れマッチング後推定(FMPE)は大気圏探索のための新しい機械学習手法である。
FMPEは神経後部推定(NPE)の約3倍の速度でトレーニングし、IS効率を高める。
ISは不正確なML結果の修正に成功し、低効率でモデルの失敗を特定し、ベイズ証拠の正確な見積もりを提供する。
論文 参考訳(メタデータ) (2024-10-28T19:28:07Z) - Kolmogorov-Arnold Transformer [72.88137795439407]
Kolmogorov-Arnold Transformer(KAT)は,階層をKAN(Kolmogorov-Arnold Network)層に置き換える新しいアーキテクチャである。
C1)基本関数,(C2)非効率,(C3)重みの3つの主要な課題を特定する。
これらの設計により、KATは従来のトランスフォーマーよりも優れている。
論文 参考訳(メタデータ) (2024-09-16T17:54:51Z) - S3-SLAM: Sparse Tri-plane Encoding for Neural Implicit SLAM [15.093795136143257]
現在のニューラル暗黙のSLAMは、性能とパラメータ数の間の困難なトレードオフ問題に直面している。
一般的な3平面パラメータの24%しか使用せず,解像度512までのシーン再構成を効率的に行うことのできるスパース三平面符号化を提案する。
論文 参考訳(メタデータ) (2024-04-28T19:02:54Z) - CryoFormer: Continuous Heterogeneous Cryo-EM Reconstruction using
Transformer-based Neural Representations [49.49939711956354]
核電子顕微鏡(cryo-EM)は、タンパク質やその他の生体分子の3D構造を高分解能で再構築することを可能にする。
3次元構造の連続的な動きをノイズやランダムに配向した2次元Creo-EM画像から再構成することは依然として困難である。
我々はCryoFormerを提案する。CryoFormerは連続したヘテロジニアスCryo-EM再構成のための新しいアプローチである。
論文 参考訳(メタデータ) (2023-03-28T18:59:17Z) - The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in
Transformers [59.87030906486969]
本稿では,Transformer アーキテクチャを用いた機械学習モデルにおいて,アクティベーションマップが疎いという興味深い現象について考察する。
本稿では, 自然言語処理と視覚処理の両方において, スパーシリティが顕著な現象であることを示す。
本稿では,変換器のFLOP数を大幅に削減し,効率を向上する手法について論じる。
論文 参考訳(メタデータ) (2022-10-12T15:25:19Z) - Improved surface reconstruction using high-frequency details [44.73668037810989]
ニューラルレンダリングにおける表面再構成の品質向上のための新しい手法を提案する。
以上の結果から,本手法は高頻度表面の細部を再構築し,現状よりも優れた表面の再現性が得られることがわかった。
論文 参考訳(メタデータ) (2022-06-15T23:46:48Z) - BNV-Fusion: Dense 3D Reconstruction using Bi-level Neural Volume Fusion [85.24673400250671]
ニューラル・ボリューム・フュージョン (BNV-Fusion) は, ニューラル・暗黙表現とニューラル・レンダリングの最近の進歩を活用して高密度3次元再構成を行う。
新しい深度マップをグローバルな暗黙的表現に漸進的に統合するために、我々は新しい二段階融合戦略を提案する。
提案手法を定量的に定性的に評価し,既存手法よりも有意な改善を示した。
論文 参考訳(メタデータ) (2022-04-03T19:33:09Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - Robust Sound Source Tracking Using SRP-PHAT and 3D Convolutional Neural
Networks [10.089520556398574]
本稿では,SRP-PHATアルゴリズムと3次元畳み込みニューラルネットワークに基づく単一音源DOA推定・追跡システムを提案する。
SRP-PHATパワーマップを完全な畳み込み因果アーキテクチャの入力特徴として使用し、3次元畳み込み層を用いて音源の追跡を正確に行う。
論文 参考訳(メタデータ) (2020-06-16T09:07:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。