Fugu-MT 論文翻訳(概要): SparseCraft: Few-Shot Neural Reconstruction through Stereopsis Guided Geometric Linearization

論文の概要: SparseCraft: Few-Shot Neural Reconstruction through Stereopsis Guided Geometric Linearization

arxiv url: http://arxiv.org/abs/2407.14257v1
Date: Fri, 19 Jul 2024 12:36:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-22 17:34:39.031734
Title: SparseCraft: Few-Shot Neural Reconstruction through Stereopsis Guided Geometric Linearization
Title（参考訳）: SparseCraft: ステレオプシス誘導幾何線形化によるFew-Shotニューラルリコンストラクション
Authors: Mae Younes, Amine Ouasfi, Adnane Boukhayma,
Abstract要約: そこで本研究では,数枚のカラー画像から3次元形状とビュー依存の外観を復元する新しい手法を提案する。本手法は,信号距離関数 (Signed Distance Function, SDF) と放射場 (Radiance Field) の形式で暗黙的なニューラル表現を学習する。我々の貢献の鍵は、SDFフィールドがレベルセットの近くでできるだけ直線的であることを奨励する、暗黙の神経形状関数学習戦略である。
参考スコア（独自算出の注目度）: 7.769607568805291
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present a novel approach for recovering 3D shape and view dependent appearance from a few colored images, enabling efficient 3D reconstruction and novel view synthesis. Our method learns an implicit neural representation in the form of a Signed Distance Function (SDF) and a radiance field. The model is trained progressively through ray marching enabled volumetric rendering, and regularized with learning-free multi-view stereo (MVS) cues. Key to our contribution is a novel implicit neural shape function learning strategy that encourages our SDF field to be as linear as possible near the level-set, hence robustifying the training against noise emanating from the supervision and regularization signals. Without using any pretrained priors, our method, called SparseCraft, achieves state-of-the-art performances both in novel-view synthesis and reconstruction from sparse views in standard benchmarks, while requiring less than 10 minutes for training.
Abstract（参考訳）: 本稿では,数枚のカラー画像から3次元形状とビュー依存外観を復元し,効率的な3次元再構成と新しいビュー合成を実現するための新しいアプローチを提案する。本手法は,信号距離関数 (Signed Distance Function, SDF) と放射場 (Radiance Field) の形式で暗黙的なニューラル表現を学習する。このモデルは、レイマーチング可能なボリュームレンダリングによって徐々に訓練され、学習不要なマルチビューステレオ(MVS)で正規化される。私たちの貢献の鍵となるのは、SDFフィールドが可能な限りレベルセット近くで線形であることを促す、暗黙の神経形状関数学習戦略です。 SparseCraftと呼ばれる事前トレーニングを使わずに、標準ベンチマークのスパースビューからの新規ビュー合成と再構築の両面で最先端のパフォーマンスを達成し、トレーニングに10分未満の時間を要する。

関連論文リスト

A self-supervised cyclic neural-analytic approach for novel view synthesis and 3D reconstruction [11.558827428811385]
本稿では、高品質なニューラルネットワークレンダリング出力と分析手法からの正確な幾何学的洞察を組み合わせた自己教師付き循環型ニューラルネットワークパイプラインを提案する。我々のソリューションは、新しいビュー合成のためのRGBとメッシュ再構成を改善し、特にトレーニングデータセットとは全く異なるアンサンプされた領域や領域で改善する。以上の結果から,新規な3次元画像のレンダリングや3次元画像の再構成が大幅に向上していることが示唆された。
論文参考訳（メタデータ） (2025-03-05T14:28:01Z)
FewViewGS: Gaussian Splatting with Few View Matching and Multi-stage Training [15.634646420318731]
スパース入力画像を用いた3次元ガウス型新規ビュー合成法を提案する。本稿では,新しい視点に課せられる整合性制約を考慮した多段階学習手法を提案する。これは、利用可能なトレーニング画像のマッチングを使用して、新しいビューの生成を監督することで達成される。
論文参考訳（メタデータ） (2024-11-04T16:21:00Z)
Few-Shot Unsupervised Implicit Neural Shape Representation Learning with Spatial Adversaries [8.732260277121547]
Inlicit Neural Representationsは、複雑なデータモダリティをキャプチャする強力なフレームワークとして注目されている。 3次元形状表現の領域内では、ニューラルネットワーク符号距離関数(SDF)は複雑な形状幾何を忠実に符号化する顕著な可能性を示している。
論文参考訳（メタデータ） (2024-08-27T14:54:33Z)
DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文参考訳（メタデータ） (2023-11-30T21:34:44Z)
Learning to Render Novel Views from Wide-Baseline Stereo Pairs [26.528667940013598]
本稿では,単一の広線ステレオ画像ペアのみを付与した新しいビュー合成手法を提案する。スパース観測による新しいビュー合成への既存のアプローチは、誤った3次元形状の復元によって失敗する。対象光線に対する画像特徴を組み立てるための,効率的な画像空間のエピポーラ線サンプリング手法を提案する。
論文参考訳（メタデータ） (2023-04-17T17:40:52Z)
Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction [77.69363640021503]
3D対応画像合成は、シーン生成や画像からの新規ビュー合成など、様々なタスクを含む。本稿では,様々な物体の多視点画像から,ニューラルラディアンス場(NeRF)の一般化可能な事前学習を行うために,表現拡散モデルを用いた統一的アプローチであるSSDNeRFを提案する。
論文参考訳（メタデータ） (2023-04-13T17:59:01Z)
SceneRF: Self-Supervised Monocular 3D Scene Reconstruction with Radiance Fields [19.740018132105757]
SceneRFは、画像列のみを用いた自己教師付き単眼シーン再構築法である。推測において、単一の入力画像は、融合した新しい深度ビューを幻覚させ、3Dシーンの再構成を得るのに十分である。
論文参考訳（メタデータ） (2022-12-05T18:59:57Z)
Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文参考訳（メタデータ） (2022-05-25T17:59:53Z)
Light Field Networks: Neural Scene Representations with Single-Evaluation Rendering [60.02806355570514]
2次元観察から3Dシーンの表現を推定することは、コンピュータグラフィックス、コンピュータビジョン、人工知能の基本的な問題である。そこで我々は,360度4次元光場における基礎となる3次元シーンの形状と外観の両面を表現した新しいニューラルシーン表現,光場ネットワーク(LFN)を提案する。 LFNからレイをレンダリングするには*single*ネットワークの評価しか必要としない。
論文参考訳（メタデータ） (2021-06-04T17:54:49Z)
MVSNeRF: Fast Generalizable Radiance Field Reconstruction from Multi-View Stereo [52.329580781898116]
MVSNeRFは、ビュー合成のための神経放射場を効率的に再構築できる新しいニューラルレンダリング手法である。高密度にキャプチャされた画像に対して,シーン毎の最適化を考慮に入れたニューラルネットワークの先行研究とは異なり,高速ネットワーク推論により,近傍の3つの入力ビューのみからラミアンスフィールドを再構成できる汎用ディープニューラルネットワークを提案する。
論文参考訳（メタデータ） (2021-03-29T13:15:23Z)
SDF-SRN: Learning Signed Distance 3D Object Reconstruction from Static Images [44.78174845839193]
近年の取り組みは、注釈付き2DシルエットによるRGB画像から3Dの監督なしに3Dの再構築を学ぶことに変わった。これらのテクニックは、トレーニング中に同じオブジェクトインスタンスのマルチビューアノテーションを必要とする。本研究では,SDF-SRNを提案する。
論文参考訳（メタデータ） (2020-10-20T17:59:47Z)
Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文参考訳（メタデータ） (2020-08-16T13:38:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。