論文の概要: ReLU Fields: The Little Non-linearity That Could
- arxiv url: http://arxiv.org/abs/2205.10824v1
- Date: Sun, 22 May 2022 13:42:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 19:18:11.733357
- Title: ReLU Fields: The Little Non-linearity That Could
- Title(参考訳): ReLU Fields: 最小限の非線形性
- Authors: Animesh Karnewar and Tobias Ritschel and Oliver Wang and Niloy J.
Mitra
- Abstract要約: 我々は,高忠実度結果の保持を可能にするグリッドベース表現に対する最小の変更点について検討する。
このようなアプローチが最先端技術と競合することを示します。
- 参考スコア(独自算出の注目度): 62.228229880658404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many recent works, multi-layer perceptions (MLPs) have been shown to be
suitable for modeling complex spatially-varying functions including images and
3D scenes. Although the MLPs are able to represent complex scenes with
unprecedented quality and memory footprint, this expressive power of the MLPs,
however, comes at the cost of long training and inference times. On the other
hand, bilinear/trilinear interpolation on regular grid based representations
can give fast training and inference times, but cannot match the quality of
MLPs without requiring significant additional memory. Hence, in this work, we
investigate what is the smallest change to grid-based representations that
allows for retaining the high fidelity result of MLPs while enabling fast
reconstruction and rendering times. We introduce a surprisingly simple change
that achieves this task -- simply allowing a fixed non-linearity (ReLU) on
interpolated grid values. When combined with coarse to-fine optimization, we
show that such an approach becomes competitive with the state-of-the-art. We
report results on radiance fields, and occupancy fields, and compare against
multiple existing alternatives. Code and data for the paper are available at
https://geometry.cs.ucl.ac.uk/projects/2022/relu_fields.
- Abstract(参考訳): 近年の多くの研究において、多層知覚(mlps)は、画像や3dシーンを含む複雑な空間変動関数のモデリングに適していることが示されている。
MLPは、前例のない品質とメモリフットプリントを持つ複雑なシーンを表現できるが、MLPのこの表現力は、長いトレーニングと推論のコストがかかる。
一方、正規グリッドベース表現上の双線形/トリ線形補間は、高速なトレーニングと推論時間を与えるが、重要な追加メモリを必要とすることなく、MPPの品質にマッチすることができない。
そこで本研究では,MLPの高忠実度を保ちつつ,高速な再構成とレンダリングを可能としたグリッドベース表現の最小変化について検討する。
単純に補間されたグリッド値に固定された非線形性(relu)を許可するのです。
粗粒度最適化と組み合わせることで、そのようなアプローチが最先端技術と競合することを示す。
本報告では, 放射場, 占有場について報告し, 既存の複数の代替品との比較を行った。
この論文のコードとデータは、https://geometry.cs.ucl.ac.uk/projects/2022/relu_fieldsで入手できる。
関連論文リスト
- MeshFeat: Multi-Resolution Features for Neural Fields on Meshes [38.93284476165776]
パラメトリック特徴格子符号化は、ニューラルネットワークの符号化手法として注目されている。
Euclidean空間のマルチレゾリューション機能グリッドの考え方を適応させるために,メッシュ用に調整されたパラメトリック機能であるMeshFeatを提案する。
テクスチャ再構築とBRDF表現に匹敵する再現品質を維持しつつ, 従来の表現と比較して, 大幅な高速化を示した。
論文 参考訳(メタデータ) (2024-07-18T15:29:48Z) - ResFields: Residual Neural Fields for Spatiotemporal Signals [61.44420761752655]
ResFieldsは、複雑な時間的信号を効果的に表現するために設計された新しいネットワークのクラスである。
本稿では,ResFieldの特性を包括的に解析し,トレーニング可能なパラメータの数を減らすための行列分解手法を提案する。
スパースRGBDカメラからダイナミックな3Dシーンをキャプチャする効果を示すことで,ResFieldsの実用性を実証する。
論文 参考訳(メタデータ) (2023-09-06T16:59:36Z) - Strip-MLP: Efficient Token Interaction for Vision MLP [31.02197585697145]
textbfStrip-MLPを導入し,トークン間相互作用を3つの方法で強化する。
Strip-MLPは、小さなデータセット上での空間モデルの性能を大幅に改善する。
CIFAR-100ではCaltech-101では+2.44%、CIFAR-100では+2.16%である。
論文 参考訳(メタデータ) (2023-07-21T09:40:42Z) - Multiscale Representation for Real-Time Anti-Aliasing Neural Rendering [84.37776381343662]
Mip-NeRFは、スケール情報をエンコードする円錐フラストラムとしてマルチスケール表現を提案する。
我々は,リアルタイムなアンチエイリアスレンダリングのためのマルチスケールな明示的表現であるmip voxel grids (Mip-VoG)を提案する。
私たちのアプローチは、マルチスケールのトレーニングとリアルタイムのアンチエイリアスレンダリングを同時に提供する最初の方法です。
論文 参考訳(メタデータ) (2023-04-20T04:05:22Z) - Hybrid Mesh-neural Representation for 3D Transparent Object
Reconstruction [30.66452291775852]
自然光条件下で手持ちの撮像画像を用いて透明物体の3次元形状を復元する新しい手法を提案する。
明示的なメッシュとハイブリッド表現であるマルチレイヤパーセプトロン(MLP)ネットワークの利点を組み合わせて、最近のコントリビューションで使用されるキャプチャを簡素化する。
論文 参考訳(メタデータ) (2022-03-23T17:58:56Z) - CoordX: Accelerating Implicit Neural Representation with a Split MLP
Architecture [2.6912336656165805]
多層パーセプトロン(MLP)を用いた暗黙の神経表現は、近年、様々なタスクで注目されている。
座標に基づく表現の推論と訓練を高速化する新しい分割アーキテクチャであるCoordXを提案する。
画像,映像,3次元形状表現および描画タスクのベースラインモデルと比較して,最大2.92倍のスピードアップを示す。
論文 参考訳(メタデータ) (2022-01-28T21:30:42Z) - RepMLPNet: Hierarchical Vision MLP with Re-parameterized Locality [113.1414517605892]
そこで本研究では,FC層に局所前処理を組み込む手法であるLocality Injectionを提案する。
RepMLPNetはCityscapesセマンティックセグメンテーションにシームレスに移行した最初の企業である。
論文 参考訳(メタデータ) (2021-12-21T10:28:17Z) - Hire-MLP: Vision MLP via Hierarchical Rearrangement [58.33383667626998]
Hire-MLPは、再配置によるシンプルだが競合する視覚アーキテクチャである。
提案したHire-MLPアーキテクチャは、単純なチャネル混合操作で構築されており、高い柔軟性と推論速度を享受できる。
実験の結果,Herre-MLPはImageNet-1Kベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2021-08-30T16:11:04Z) - CycleMLP: A MLP-like Architecture for Dense Prediction [26.74203747156439]
CycleMLPは視覚認識と密度予測のための汎用的なバックボーンである。
様々な画像サイズに対処でき、ローカルウィンドウを使用することで、画像サイズに対する線形計算の複雑さを実現する。
CycleMLPは、モデルに対するオブジェクト検出、インスタンスセグメンテーション、セマンティックセグメンテーションの競合するベースラインを提供することを目的としている。
論文 参考訳(メタデータ) (2021-07-21T17:23:06Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。