論文の概要: Ray-ONet: Efficient 3D Reconstruction From A Single RGB Image
- arxiv url: http://arxiv.org/abs/2107.01899v1
- Date: Mon, 5 Jul 2021 09:45:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 19:19:15.964828
- Title: Ray-ONet: Efficient 3D Reconstruction From A Single RGB Image
- Title(参考訳): Ray-ONet:1枚のRGB画像から効率的な3D再構成
- Authors: Wenjing Bian and Zirui Wang and Kejie Li and Victor Adrian Prisacariu
- Abstract要約: モノクロ画像から詳細な3Dモデルを効率的に再構成するためのRay-ONetを提案する。
カメラ座標の画素からバックプロジェクションされた光線に沿った一連の占有確率を予測することにより、我々の方法であるRay-ONetは、Occupancy Networks (ONet)と比較して再構成精度を向上させる。
- 参考スコア(独自算出の注目度): 16.21925131245367
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We propose Ray-ONet to reconstruct detailed 3D models from monocular images
efficiently. By predicting a series of occupancy probabilities along a ray that
is back-projected from a pixel in the camera coordinate, our method Ray-ONet
improves the reconstruction accuracy in comparison with Occupancy Networks
(ONet), while reducing the network inference complexity to O($N^2$). As a
result, Ray-ONet achieves state-of-the-art performance on the ShapeNet
benchmark with more than 20$\times$ speed-up at $128^3$ resolution and
maintains a similar memory footprint during inference.
- Abstract(参考訳): 単眼画像から詳細な3次元モデルを効率的に再構成するためのray-onetを提案する。
カメラ座標の画素からバックプロジェクションされた光線に沿った一連の占有確率を予測することにより,Occupancy Networks (ONet) と比較して再構成精度を向上させるとともに,ネットワーク推論の複雑さをO($N^2$)に低減する。
その結果、Ray-ONetはShapeNetベンチマークで20$\times$のスピードアップを128^3$の解像度で達成し、推論中に同様のメモリフットプリントを維持する。
関連論文リスト
- Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.48403838439391]
3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文 参考訳(メタデータ) (2024-05-26T12:26:54Z) - N-BVH: Neural ray queries with bounding volume hierarchies [51.430495562430565]
3Dコンピュータグラフィックスでは、シーンのメモリ使用量の大部分がポリゴンとテクスチャによるものである。
N-BVHは3次元の任意の光線クエリに応答するように設計されたニューラル圧縮アーキテクチャである。
本手法は, 視認性, 深度, 外観特性を忠実に近似する。
論文 参考訳(メタデータ) (2024-05-25T13:54:34Z) - Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction [153.52406455209538]
Gambaは、単一のビューイメージからエンドツーエンドの3D再構成モデルである。
1つのNVIDIA A100 GPUで0.05秒以内に再構築が完了する。
論文 参考訳(メタデータ) (2024-03-27T17:40:14Z) - Splatter Image: Ultra-Fast Single-View 3D Reconstruction [67.96212093828179]
Splatter ImageはGaussian Splattingをベースにしており、複数の画像から3Dシーンを高速かつ高品質に再現することができる。
テスト時に38FPSでフィードフォワードで再構成を行うニューラルネットワークを学習する。
いくつかの総合、実、マルチカテゴリ、大規模ベンチマークデータセットにおいて、トレーニング中にPSNR、LPIPS、その他のメトリクスでより良い結果を得る。
論文 参考訳(メタデータ) (2023-12-20T16:14:58Z) - RayMVSNet++: Learning Ray-based 1D Implicit Fields for Accurate
Multi-View Stereo [21.209964556493368]
RayMVSNetは、シーン深度を示すゼロクロスポイントを用いて、各カメラ線に沿った1次元暗黙フィールドの逐次予測を学習する。
RayMVSNet++はScanNetデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-07-16T02:10:47Z) - VolRecon: Volume Rendering of Signed Ray Distance Functions for
Generalizable Multi-View Reconstruction [64.09702079593372]
VolRecon は Signed Ray Distance Function (SRDF) を用いた新しい一般化可能な暗黙的再構成法である
DTUデータセットでは、VolReconはスパースビュー再構築においてSparseNeuSを約30%上回り、フルビュー再構築においてMVSNetと同等の精度を達成する。
論文 参考訳(メタデータ) (2022-12-15T18:59:54Z) - FIRe: Fast Inverse Rendering using Directional and Signed Distance
Functions [97.5540646069663]
指向性距離関数(DDF)と呼ばれる新しいニューラルシーン表現を導入する。
DDFは単位球上で定義され、任意の方向に沿って表面までの距離を予測する。
提案手法はDDFに基づいて,提案した深度マップから3次元形状を再構成する高速アルゴリズム (FIRe) を提案する。
論文 参考訳(メタデータ) (2022-03-30T13:24:04Z) - FIDNet: LiDAR Point Cloud Semantic Segmentation with Fully Interpolation
Decoding [5.599306291149907]
2次元球面領域画像上に点雲を投影すると、LiDARセマンティックセマンティックセマンティックセマンティクスがレンジ画像上の2次元セマンティクスタスクに変換される。
本稿では,新しいネットワーク構造と効率的な後処理ステップからなる投影型LiDARセマンティックセマンティックセマンティクスパイプラインを提案する。
我々のパイプラインは、40倍の2048$の解像度を持つプロジェクションベースのメソッドと、すべてのポイントワイズソリューションの中で、最高のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2021-09-08T17:20:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。