論文の概要: SAM 3D Animal: Promptable Animal 3D Reconstruction from Images in the Wild
- arxiv url: http://arxiv.org/abs/2605.07604v1
- Date: Fri, 08 May 2026 11:26:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.014924
- Title: SAM 3D Animal: Promptable Animal 3D Reconstruction from Images in the Wild
- Title(参考訳): 野生の画像から動物を再現するSAM 3D動物
- Authors: Xuyi Hu, Jin Lyu, Jiuming Liu, Yebin Liu, Silvia Zuffi, Liang An, Stefan Goetz,
- Abstract要約: SAM 3D Animalは, 単一画像からのマルチアニマルな3D再構成を行うための, 初のプロンプト可能なフレームワークである。
提案手法は複数のインスタンスを共同で再構築し,キーポイントとマスクの形式でフレキシブルなプロンプトをサポートする。
実験により,既存のモデルベース手法とモデルフリー手法の両方に対して,我々のフレームワークが最先端の結果を達成することが示された。
- 参考スコア(独自算出の注目度): 41.19285227066038
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D animal reconstruction in the wild remains challenging due to large species variation, frequent occlusions, and the prevalence of multi-animal scenes, while existing methods predominantly focus on single-animal settings. We present SAM 3D Animal, the first promptable framework for multi-animal 3D reconstruction from a single image. Built on the SMAL+ parametric animal model, our method jointly reconstructs multiple instances and supports flexible prompts in the form of keypoints and masks which enable more reliable disambiguation in crowded and occluded scenes. To train such a model, we further introduce Herd3D, a multi-animal 3D dataset containing over 5K images, designed to increase diversity in species, interactions, and occlusion patterns. Experiments on the Animal3D, APTv2, and Animal Kingdom datasets show that our framework achieves state-of-the-art results over both existing model-based and model-free methods, demonstrating a scalable and effective solution for prompt-driven animal 3D reconstruction in the wild.
- Abstract(参考訳): 野生動物における3D動物再構成は、大きな種多様性、頻繁な隠蔽、多動物シーンの出現などにより困難であり、既存の手法は主に単一動物環境に焦点を当てている。
SAM 3D Animalは, 単一画像からのマルチアニマルな3D再構成を行うための, 初のプロンプト可能なフレームワークである。
SMAL+パラメトリック動物モデル上に構築した本手法は,複数の事例を共同で再構成し,キーポイントとマスクの形式でフレキシブルプロンプトをサポートする。
このようなモデルをトレーニングするために,5K画像を含むマルチアニマル3DデータセットであるHerd3Dについても紹介する。
Animal3D, APTv2, およびAnimal Kingdomデータセットの実験により、我々のフレームワークは、既存のモデルベースおよびモデルフリーの手法の両方に対して最先端の成果を達成し、野生の動物3Dの迅速な再構築のためのスケーラブルで効果的なソリューションを実証した。
関連論文リスト
- Learning the 3D Fauna of the Web [70.01196719128912]
3D-Faunaは,100種以上の動物種を対象に,パンカテゴリーで変形可能な3D動物モデルを共同で学習する手法である。
動物モデリングにおける重要なボトルネックの1つは、トレーニングデータの可用性の制限である。
従来のカテゴリー固有の試みは,訓練画像に制限のある希少種への一般化に失敗することを示す。
論文 参考訳(メタデータ) (2024-01-04T18:32:48Z) - Virtual Pets: Animatable Animal Generation in 3D Scenes [84.0990909455833]
仮想ペット(Virtual Pet)は、3次元環境下での標的動物種に対する現実的で多様な動きをモデル化するための新しいパイプラインである。
我々はモノクロインターネットビデオを活用し、背景と背景の静的なNeRF表現に対して変形可能なNeRF表現を抽出する。
我々は,種レベルの共有テンプレート学習とビデオ毎の微調整を含む再構築戦略を開発する。
論文 参考訳(メタデータ) (2023-12-21T18:59:30Z) - Two-stage Synthetic Supervising and Multi-view Consistency
Self-supervising based Animal 3D Reconstruction by Single Image [30.997936022365018]
本研究では,2段階指導と自己監督訓練を組み合わせることで,動物による3Dスキャンの課題に対処する。
本研究は,鳥の3次元ディジタル化の定量的・定性的側面において,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-22T07:06:38Z) - LASSIE: Learning Articulated Shapes from Sparse Image Ensemble via 3D
Part Discovery [72.3681707384754]
そこで,本研究では,特定の動物種について,数枚の画像のみを用いて,動物の3次元ポーズと形状を推定する現実的な問題設定を提案する。
我々は2Dや3Dの地平線アノテーションを前提としないし、多視点や時間的情報も利用しない。
そこで本研究では,3次元部品を自己監督的に発見する新しい最適化フレームワークLASSIEを提案する。
論文 参考訳(メタデータ) (2022-07-07T17:00:07Z) - Self-supervised Single-view 3D Reconstruction via Semantic Consistency [142.71430568330172]
対象物の形状, テクスチャ, カメラポーズを予測できる, 自己監督型, 単視点3D再構成モデルを学習する。
提案手法では,手動で注釈付けしたキーポイント,オブジェクトのマルチビューイメージ,あるいは事前の3Dテンプレートなど,3Dの監督を必要としない。
論文 参考訳(メタデータ) (2020-03-13T20:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。