論文の概要: Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation
- arxiv url: http://arxiv.org/abs/2509.20681v1
- Date: Thu, 25 Sep 2025 02:30:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.663636
- Title: Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation
- Title(参考訳): 運動生成のための単一画像からの入射表面モデルの効率的な構築
- Authors: Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi,
- Abstract要約: 単一または少数の画像に基づいて高忠実表面とSDFフィールドを再構成する高速画像からニューラル表面(FINS)を提案する。
FINSは、軽量な幾何学とカラーヘッドを備えたマルチ解像度ハッシュグリッドを統合し、近似二階エンコーダによるトレーニングを極めて効率的にする。
同条件下では, コンバージェンス速度, 表面再構成精度, SDF場推定精度の両面で, 最先端のベースラインよりも優れることを示した。
- 参考スコア(独自算出の注目度): 10.958664484214127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Implicit representations have been widely applied in robotics for obstacle avoidance and path planning. In this paper, we explore the problem of constructing an implicit distance representation from a single image. Past methods for implicit surface reconstruction, such as \emph{NeuS} and its variants generally require a large set of multi-view images as input, and require long training times. In this work, we propose Fast Image-to-Neural Surface (FINS), a lightweight framework that can reconstruct high-fidelity surfaces and SDF fields based on a single or a small set of images. FINS integrates a multi-resolution hash grid encoder with lightweight geometry and color heads, making the training via an approximate second-order optimizer highly efficient and capable of converging within a few seconds. Additionally, we achieve the construction of a neural surface requiring only a single RGB image, by leveraging pre-trained foundation models to estimate the geometry inherent in the image. Our experiments demonstrate that under the same conditions, our method outperforms state-of-the-art baselines in both convergence speed and accuracy on surface reconstruction and SDF field estimation. Moreover, we demonstrate the applicability of FINS for robot surface following tasks and show its scalability to a variety of benchmark datasets.
- Abstract(参考訳): 障害回避と経路計画のためのロボット工学において、暗黙の表現が広く応用されている。
本稿では,単一の画像から暗黙的な距離表現を構築することの問題点を考察する。
emph{NeuS} やその変種のような従来の暗黙的な表面再構成法は、一般に入力として大量のマルチビューイメージを必要とし、長い訓練時間を必要としている。
本研究では,高忠実度表面とSDFフィールドを単一あるいは少数の画像集合に基づいて再構成する軽量なフレームワークであるFast Image-to-Neural Surface (FINS)を提案する。
FINSは、軽量な幾何学とカラーヘッドを備えたマルチ解像度のハッシュグリッドエンコーダを統合し、近似二階最適化器によるトレーニングを効率よく行い、数秒以内に収束させることができる。
さらに、トレーニング済みの基礎モデルを利用して、画像に固有の幾何を推定することにより、単一のRGB画像のみを必要とするニューラルサーフェスの構築を実現する。
同条件下では, コンバージェンス速度, 表面再構成精度, SDF場推定精度の両面で, 最先端のベースラインよりも優れることを示した。
さらに,タスク追従ロボット表面におけるFINSの適用性を示し,そのスケーラビリティを様々なベンチマークデータセットに示す。
関連論文リスト
- PR-NeuS: A Prior-based Residual Learning Paradigm for Fast Multi-view
Neural Surface Reconstruction [45.34454245176438]
高速多視点ニューラルサーフェス再構成のための事前学習パラダイムを提案する。
本手法は,1つのシーンの表面を再構築するのに3分程度しかかからず,競争力のある表面品質を実現している。
論文 参考訳(メタデータ) (2023-12-18T09:24:44Z) - Shape, Pose, and Appearance from a Single Image via Bootstrapped
Radiance Field Inversion [54.151979979158085]
提案手法では,自然画像に対する基本的エンドツーエンド再構築フレームワークを導入し,正確な地平のポーズが得られない。
そこで,モデルが解の第一の推算を生成するハイブリッド・インバージョン・スキームを適用する。
当社のフレームワークでは,イメージを10ステップでデレンダリングすることが可能で,現実的なシナリオで使用することが可能です。
論文 参考訳(メタデータ) (2022-11-21T17:42:42Z) - High-Quality RGB-D Reconstruction via Multi-View Uncalibrated
Photometric Stereo and Gradient-SDF [48.29050063823478]
本稿では、カメラのポーズ、照明、アルベド、表面の正規化に取り組み、新しい多視点RGB-Dベースの再構成手法を提案する。
提案手法は,特定の物理モデルを用いて画像描画過程を定式化し,実際の表面の体積量を最適化する。
論文 参考訳(メタデータ) (2022-10-21T19:09:08Z) - SDFEst: Categorical Pose and Shape Estimation of Objects from RGB-D
using Signed Distance Fields [5.71097144710995]
RGB-D画像からのオブジェクトのポーズと形状推定のためのモジュールパイプラインを提案する。
生成型形状モデルと新しいネットワークを統合して,単一または複数ビューからの6次元ポーズと形状推定を可能にする。
我々は、合成データと実データの両方に関するいくつかの実験において、最先端手法に対するアプローチの利点を実証する。
論文 参考訳(メタデータ) (2022-07-11T13:53:50Z) - FIRe: Fast Inverse Rendering using Directional and Signed Distance
Functions [97.5540646069663]
指向性距離関数(DDF)と呼ばれる新しいニューラルシーン表現を導入する。
DDFは単位球上で定義され、任意の方向に沿って表面までの距離を予測する。
提案手法はDDFに基づいて,提案した深度マップから3次元形状を再構成する高速アルゴリズム (FIRe) を提案する。
論文 参考訳(メタデータ) (2022-03-30T13:24:04Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Learning Signed Distance Field for Multi-view Surface Reconstruction [24.090786783370195]
ステレオマッチングと特徴整合性の知識を生かした新しいニューラルネットワーク表面再構成フレームワークを提案する。
サインされた距離場(SDF)と表面光場(SDF)をそれぞれ、シーン形状と外観を表すために適用する。
本手法は,地形推定のロバスト性を向上し,複雑なシーントポロジの再構築を支援する。
論文 参考訳(メタデータ) (2021-08-23T06:23:50Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。