論文の概要: PRIMA: Boosting Animal Mesh Recovery with Biological Priors and Test-Time Adaptation
- arxiv url: http://arxiv.org/abs/2606.02366v1
- Date: Mon, 01 Jun 2026 15:13:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.37994
- Title: PRIMA: Boosting Animal Mesh Recovery with Biological Priors and Test-Time Adaptation
- Title(参考訳): PRIMA:生物プライオリティと試験時間順応による動物のメッシュ回復の促進
- Authors: Xiaohang Yu, Ti Wang, Mackenzie Weygandt Mathis,
- Abstract要約: PRIMAは、厳しい種の下で頑丈な3次元四重項メッシュ回復のためのフレームワークであり、不均衡を引き起こす。
本研究は,BioCLIP埋め込みを生物前駆体として組み込んで,再建プロセスに意味的および形態学的知識を注入する。
多様な種をカバーし,バリエーションを呈する大規模擬似3DデータセットであるQuadruped3Dを構築した。
- 参考スコア(独自算出の注目度): 3.599033387924161
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present PRIMA (*PRI*ors for *M*esh *A*daptation), a framework for robust 3D quadruped mesh recovery under severe species and pose imbalance. Existing animal reconstruction methods often regress toward mean shapes and poses due to limited 3D supervision and long-tailed species distributions, resulting in poor generalization to underrepresented animals and rare articulations. PRIMA addresses this challenge through three key contributions. First, we incorporate BioCLIP embeddings as biological priors to inject semantic and morphological knowledge into the reconstruction process, enabling more accurate and generalizable shape prediction across diverse quadrupeds. Second, we introduce a test-time adaptation (TTA) strategy that refines SMAL predictions using 2D reprojection constraints together with auxiliary keypoint guidance, improving pose and shape estimation while enabling the generation of high-quality pseudo-3D annotations from existing 2D datasets. Third, leveraging this TTA framework, we construct Quadruped3D, a large-scale pseudo-3D dataset that covers diverse species and pose variations to systematically improve model performance. Extensive experiments on Animal3D, CtrlAni3D, Quadruped2D, and Animal Kingdom demonstrate that PRIMA achieves state-of-the-art results, with particularly strong improvements on underrepresented species and challenging poses. Our results highlight the importance of biological priors and adaptation-driven data expansion for scalable and generalizable animal mesh recovery. Code is available at https://github.com/AdaptiveMotorControlLab/PRIMA.
- Abstract(参考訳): PRIMA (*PRI*ors for *M*esh *A*daptation) は, 厳重な種の下での3次元四重項メッシュ回復のためのフレームワークであり, 不均衡を呈する。
既存の動物再建法は、しばしば3次元の監督と長い尾を持つ種分布の制限により、平均的な形やポーズに回帰する。
PRIMAはこの課題に3つの重要な貢献を通じて対処している。
まず,BioCLIP埋め込みを生物前駆体として組み込んで,意味的および形態的知識を再構築プロセスに注入し,より正確で汎用的な形状予測を可能にする。
第2に,既存の2Dデータセットから高品質な擬似3Dアノテーションを生成できるようにし,鍵ポイント誘導とともに2次元再投影制約を用いてSMAL予測を洗練させるテスト時適応(TTA)戦略を導入する。
第3に、このTTAフレームワークを活用して、様々な種をカバーする大規模擬似3DデータセットであるQuadruped3Dを構築し、モデル性能を体系的に改善する。
Animal3D、CtrlAni3D、Quadruped2D、およびAnimal Kingdomの広範囲にわたる実験は、PRIMAが最先端の結果を達成することを示した。
以上の結果から, 生物的先行性の重要性と適応型データ拡張が, スケーラブルで一般化可能な動物メッシュ回復に有効であることが示唆された。
コードはhttps://github.com/AdaptiveMotorControlLab/PRIMAで入手できる。
関連論文リスト
- SAM 3D Animal: Promptable Animal 3D Reconstruction from Images in the Wild [41.19285227066038]
SAM 3D Animalは, 単一画像からのマルチアニマルな3D再構成を行うための, 初のプロンプト可能なフレームワークである。
提案手法は複数のインスタンスを共同で再構築し,キーポイントとマスクの形式でフレキシブルなプロンプトをサポートする。
実験により,既存のモデルベース手法とモデルフリー手法の両方に対して,我々のフレームワークが最先端の結果を達成することが示された。
論文 参考訳(メタデータ) (2026-05-08T11:26:46Z) - AniMer+: Unified Pose and Shape Estimation Across Mammalia and Aves via Family-Aware Transformer [26.738709781346678]
スケーラブルなAniMerフレームワークの拡張バージョンであるAniMer+を紹介します。
AniMer+の重要なイノベーションは、その高容量、家族対応ビジョントランス(ViT)である。
CtrlAni3D for quadrupeds と CtrlAVES3D for birds の2つの大規模な合成データセットを生成した。
論文 参考訳(メタデータ) (2025-08-01T03:53:03Z) - Learning the 3D Fauna of the Web [70.01196719128912]
3D-Faunaは,100種以上の動物種を対象に,パンカテゴリーで変形可能な3D動物モデルを共同で学習する手法である。
動物モデリングにおける重要なボトルネックの1つは、トレーニングデータの可用性の制限である。
従来のカテゴリー固有の試みは,訓練画像に制限のある希少種への一般化に失敗することを示す。
論文 参考訳(メタデータ) (2024-01-04T18:32:48Z) - Animal3D: A Comprehensive Dataset of 3D Animal Pose and Shape [32.11280929126699]
哺乳類の3Dポーズと形状推定のための包括的データセットであるAnimal3Dを提案する。
動物3Dは、40種の哺乳類から収集された3379枚の画像、26個のキーポイントの高品質なアノテーション、特にSMALモデルのポーズと形状パラメータで構成されている。
The Animal3D data based on the Animal3D dataset, we benchmark representative shape and pose Estimation model at (1) 教師付き学習, (2) 合成画像から実写への変換, 3) 微調整された人間のポーズと形状推定モデル。
論文 参考訳(メタデータ) (2023-08-22T18:57:07Z) - Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文 参考訳(メタデータ) (2023-08-18T16:41:57Z) - EVOPOSE: A Recursive Transformer For 3D Human Pose Estimation With
Kinematic Structure Priors [72.33767389878473]
本研究では,3次元ポーズ推定を効果的に行うために,トランスフォーマーを用いたモデルEvoPoseを提案する。
構造的優先表現(Structure Priors Representation, SPR)モジュールは、人体パターンの豊富な構造的特徴として、人間の先行を表現している。
推定結果を利用して3Dポーズ出力にRecursive Refinement(RR)モジュールを印加し、同時に人間を注入する。
論文 参考訳(メタデータ) (2023-06-16T04:09:16Z) - Recovering 3D Human Mesh from Monocular Images: A Survey [49.00136388529404]
単眼画像から人間のポーズと形状を推定することは、コンピュータビジョンにおける長年の問題である。
本調査は, 単分子型3次元メッシュ回収の課題に焦点を当てた。
論文 参考訳(メタデータ) (2022-03-03T18:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。