論文の概要: ArtSplat: Feed-Forward Articulated 3D Gaussian Splatting from Sparse Multi-State Uncalibrated Views
- arxiv url: http://arxiv.org/abs/2605.24304v1
- Date: Sat, 23 May 2026 00:31:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.860211
- Title: ArtSplat: Feed-Forward Articulated 3D Gaussian Splatting from Sparse Multi-State Uncalibrated Views
- Title(参考訳): ArtSplat: スパース多状態非校正視点からのフィードフォワードArticulated 3D Gaussian Splatting
- Authors: Inseo Lee, Yoonji Kim, Eugene Sohn, Jiwoong Lee, Jungmin You, Joonseok Lee, Jin-Hwa Kim,
- Abstract要約: ArtSplatは3D Gaussian Splattingのための最初のフィードフォワードフレームワークである。
単一の前方通過で複数の調音状態にわたるスパース多視点画像から幾何学的パラメータと関節的パラメータの両方を再構成する。
PartNet-Mobilityの68個の明瞭なオブジェクトに対する実験では、ArtSplatは、ベースラインの400倍以上の速度で、幾何学的および関節的推定の両方において競合性能を達成している。
- 参考スコア(独自算出の注目度): 26.73085272044419
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Articulated object reconstruction from sparse-view images is an ill-posed problem that requires simultaneous inference of geometry and underlying articulation structure. Existing methods for articulated object reconstruction based on NeRF and 3D Gaussian Splatting (3DGS) typically rely on dense views or strong priors (e.g., depth maps, joint types, predefined number of joints) and require costly per-object optimization. In this paper, we propose ArtSplat, the first feed-forward framework for articulated 3D Gaussian Splatting. It reconstructs both geometry and joint parameters from sparse multi-view images across multiple articulation states in a single forward pass. To address the challenges of single-pass articulated reconstruction, we introduce a per-pixel joint map representation that enables the integration of joint parameter estimation into the feed-forward pipeline. We further propose a Cross-State Attention (CSA) mechanism with state tokens, which effectively captures discrete motion across input states. Experiments on 68 articulated objects from PartNet-Mobility, including both single- and multi-joint configurations, demonstrate that ArtSplat achieves competitive performance in both geometry and joint estimation, while being over 400 times faster than baselines.
- Abstract(参考訳): スパースビュー画像からのArticulated Object Restructionは、幾何学と下層の調音構造を同時に推測する必要がある不適切な問題である。
NeRF と 3D Gaussian Splatting (3DGS) に基づく既存のオブジェクト再構成法は、一般的に、高密度なビューや強い先行(例えば、深度マップ、関節タイプ、予め定義された関節数)に依存しており、オブジェクトごとの最適化に費用がかかる。
本稿では,3次元ガウス合成のための最初のフィードフォワードフレームワークであるArtSplatを提案する。
単一の前方通過で複数の調音状態にわたるスパース多視点画像から幾何学的パラメータと関節的パラメータの両方を再構成する。
シングルパス音声再構成の課題に対処するため, フィードフォワードパイプラインへのジョイントパラメータ推定の統合を可能にする, 画素ごとのジョイントマップ表現を導入する。
さらに、入力状態間の離散的な動きを効果的にキャプチャする状態トークン付きクロスステートアテンション(CSA)機構を提案する。
PartNet-Mobilityの68個の明瞭なオブジェクトに対する実験では、ArtSplatは、ベースラインの400倍以上の速度で、幾何学的および関節的推定の両方において競合性能を達成している。
関連論文リスト
- ArtMesh: Part-Aware Articulated Mesh Fields with Motion-Consistent Dynamics [22.43942785482678]
ArtMeshは、接続された三角形メッシュと部品ごとの剛性運動を明示的に再構成するメッシュネイティブな方法である。
Articulate-100は16のPartNet-Mobilityカテゴリにまたがる100のオーケストレートオブジェクトのベンチマークである。
論文 参考訳(メタデータ) (2026-05-15T19:37:55Z) - UniQueR: Unified Query-based Feedforward 3D Reconstruction [68.01984215138098]
提案するUniQueRは,未提示画像からの3次元再構成を効率よく正確に行うための,クエリベースの統合フィードフォワードフレームワークである。
我々のモデルは、明示的な幾何学的クエリとして機能する3Dアンカー点のコンパクトな集合を学習する。
Mip-NeRF 360とVR-NeRFの実験により、UniQueRはレンダリング品質と幾何学的精度の両方において最先端のフィードフォワード法を上回ることを示した。
論文 参考訳(メタデータ) (2026-03-24T06:42:02Z) - 2Xplat: Two Experts Are Better Than One Generalist [22.824154073395878]
本稿では,ポーズフリーフィードフォワード3DGSフレームワークである2Xplatを紹介する。
専用の幾何学の専門家が最初にカメラのポーズを予測し、3Dガウスを合成する強力な外見の専門家に明示的に渡される。
その概念的単純さは先行研究で大半が過小評価されているにもかかわらず、提案手法は極めて効果的であることが証明されている。
論文 参考訳(メタデータ) (2026-03-22T05:14:38Z) - Joint Geometry-Appearance Human Reconstruction in a Unified Latent Space via Bridge Diffusion [57.09673862519791]
本稿では,幾何学と外観のモデリングを結合潜在表現に統一する新しいフレームワークである textbfJGA-LBD を紹介する。
実験により、JGA-LBDは、幾何学的忠実度と外観品質の両方の観点から、現在の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2026-01-01T12:48:56Z) - REArtGS++: Generalizable Articulation Reconstruction with Temporal Geometry Constraint via Planar Gaussian Splatting [44.02799256666578]
一般化可能なオブジェクト再構成のための新しい手法であるREArtGS++を提案する。
本研究はまず, 従来型を使わずに各関節の脱結合スクリュー運動をモデル化し, 関節パラメータによる部分認識ガウス運動を最適化する。
合成および実世界の調音物体に対する実験は、一般化可能な部分レベル表面再構成と関節パラメータ推定において、我々の優位性を示す。
論文 参考訳(メタデータ) (2025-11-21T09:07:56Z) - SeqAffordSplat: Scene-level Sequential Affordance Reasoning on 3D Gaussian Splatting [85.87902260102652]
本稿では, 連続3次元ガウシアン・アフラマンス推論の課題について紹介する。
次に,SeqSplatNetを提案する。SqSplatNetは,命令を直接3Dアベイランスマスクのシーケンスにマッピングするエンドツーエンドフレームワークである。
本手法は,1段階のインタラクションから,シーンレベルでの複雑なシーケンシャルなタスクへの可利用性推論を効果的に向上させる。
論文 参考訳(メタデータ) (2025-07-31T17:56:55Z) - FreeSplat: Generalizable 3D Gaussian Splatting Towards Free-View Synthesis of Indoor Scenes [50.534213038479926]
FreeSplatは、長いシーケンス入力から自由視点合成まで、幾何学的に一貫した3Dシーンを再構築することができる。
ビュー数に関係なく、広いビュー範囲にわたる堅牢なビュー合成を実現するための、シンプルで効果的なフリービュートレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-05-28T08:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。