論文の概要: VENI: Variational Encoder for Natural Illumination
- arxiv url: http://arxiv.org/abs/2601.14079v1
- Date: Tue, 20 Jan 2026 15:38:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.388143
- Title: VENI: Variational Encoder for Natural Illumination
- Title(参考訳): VENI:自然照明用変分エンコーダ
- Authors: Paul Walker, James A. D. Gardner, Andreea Ardelean, William A. P. Smith, Bernhard Egger,
- Abstract要約: 逆レンダリングは不適切な問題であるが、照明前処理のような先行処理はそれを単純化することができる。
2次元投影に頼らずに球面上の自然照明をモデル化する回転同変変変分オートエンコーダを提案する。
- 参考スコア(独自算出の注目度): 9.265769190096838
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inverse rendering is an ill-posed problem, but priors like illumination priors, can simplify it. Existing work either disregards the spherical and rotation-equivariant nature of illumination environments or does not provide a well-behaved latent space. We propose a rotation-equivariant variational autoencoder that models natural illumination on the sphere without relying on 2D projections. To preserve the SO(2)-equivariance of environment maps, we use a novel Vector Neuron Vision Transformer (VN-ViT) as encoder and a rotation-equivariant conditional neural field as decoder. In the encoder, we reduce the equivariance from SO(3) to SO(2) using a novel SO(2)-equivariant fully connected layer, an extension of Vector Neurons. We show that our SO(2)-equivariant fully connected layer outperforms standard Vector Neurons when used in our SO(2)-equivariant model. Compared to previous methods, our variational autoencoder enables smoother interpolation in latent space and offers a more well-behaved latent space.
- Abstract(参考訳): 逆レンダリングは不適切な問題であるが、照明前処理のような前処理はそれを単純化することができる。
既存の作業は照明環境の球面および回転同変の性質を無視するか、あるいは十分に定義された潜在空間を提供しない。
2次元投影に頼らずに球面上の自然照明をモデル化する回転同変変変分オートエンコーダを提案する。
環境マップのSO(2)-等価性を維持するために,新しいベクトルニューロンビジョン変換器(VN-ViT)をエンコーダとして,回転同変条件のニューラルネットワークをデコーダとして使用する。
エンコーダでは、新しいSO(2)-同変完全連結層(ベクトルニューロンの拡張)を用いて、SO(3)からSO(2)への平衡を減少させる。
我々は、SO(2)-同変モデルを用いた場合、SO(2)-同変完全連結層が標準ベクトルニューロンより優れていることを示す。
従来の手法と比較して、変動型オートエンコーダは潜伏空間のスムーズな補間を可能にし、より良好な潜伏空間を提供する。
関連論文リスト
- RENI++ A Rotation-Equivariant, Scale-Invariant, Natural Illumination
Prior [22.675951948615825]
逆レンダリングは不適切な問題である。
現在の手法は球面調和照明や他の一般的な表現に依存している。
等価オートデコーダに基づく条件付きニューラルネットワーク表現を提案する。
我々は、1.6K HDR環境マップのデータセットに基づいてモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-15T20:48:26Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - 2-D SSM: A General Spatial Layer for Visual Transformers [79.4957965474334]
コンピュータビジョンの中心的な目的は、適切な2次元帰納バイアスを持つモデルを設計することである。
多次元状態空間モデルの表現的変動を利用する。
本稿では,効率的なパラメータ化,高速化計算,適切な正規化方式を提案する。
論文 参考訳(メタデータ) (2023-06-11T09:41:37Z) - Generalizing Neural Human Fitting to Unseen Poses With Articulated SE(3)
Equivariance [48.39751410262664]
ArtEqは、点雲からのSMPLモデル推定のための部分ベースSE(3)等価ニューラルネットワークである。
実験の結果,ArtEqはトレーニング中に見えない動作を一般化し,身体再建精度の点で最先端の手法を44%上回った。
論文 参考訳(メタデータ) (2023-04-20T17:58:26Z) - Rotation-Invariant Transformer for Point Cloud Matching [42.5714375149213]
我々は,回転不変変換器であるRoITrを導入し,点クラウドマッチングタスクにおけるポーズ変動に対処する。
本稿では,自己認識機構によって学習した,回転不変なクロスフレーム空間認識を備えたグローバルトランスフォーマーを提案する。
RoITrは、Inlier RatioとRegistration Recallの点で、既存のメソッドを少なくとも13と5のパーセンテージで上回っている。
論文 参考訳(メタデータ) (2023-03-14T20:55:27Z) - VNT-Net: Rotational Invariant Vector Neuron Transformers [3.04585143845864]
本稿では,最近導入されたベクトルニューロンと自己注意層を組み合わせた回転不変ニューラルネットワークを提案する。
実験により、我々のネットワークは任意のポーズで3Dポイントのクラウドオブジェクトを効率的に処理することを示した。
論文 参考訳(メタデータ) (2022-05-19T16:51:56Z) - Shape-Pose Disentanglement using SE(3)-equivariant Vector Neurons [59.83721247071963]
本研究では,点雲を標準形状表現に符号化するための教師なし手法を提案する。
エンコーダは安定で一貫性があり、形状のエンコーダは純粋にポーズ不変である。
抽出された回転と変換は、同じクラスの異なる入力形状を共通の標準ポーズに意味的に整合させることができる。
論文 参考訳(メタデータ) (2022-04-03T21:00:44Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - Rotationally Equivariant Neural Operators for Learning Transformations
on Tensor Fields (eg 3D Images and Vector Fields) [0.0]
テンソル場の集合間の変換および回転同変変換と同様に、学習解像度不変量に対する同変ニューラル作用素を導入する。
我々のテンソル場畳み込み層は任意の線型作用素をエミュレートし、そのインパルス応答やグリーン関数を畳み込み核として学習する。
E3NN, TBNN, FNOの概念を統一することにより, 工学および量子化学における幅広いPDEおよび力学系の予測性能が向上する。
論文 参考訳(メタデータ) (2021-08-21T16:31:53Z) - Rotation-Invariant Autoencoders for Signals on Spheres [10.406659081400354]
球面画像に対する回転不変表現の教師なし学習の問題について検討する。
特に、$S2$と$SO(3)$の畳み込み層からなるオートエンコーダアーキテクチャを設計する。
複数のデータセットの実験は、クラスタリング、検索、分類アプリケーションにおける学習された表現の有用性を示す。
論文 参考訳(メタデータ) (2020-12-08T15:15:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。