論文の概要: End-to-End Motion Capture from Rigid Body Markers with Geodesic Loss
- arxiv url: http://arxiv.org/abs/2511.16418v1
- Date: Thu, 20 Nov 2025 14:43:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.676284
- Title: End-to-End Motion Capture from Rigid Body Markers with Geodesic Loss
- Title(参考訳): 測地的損失を有する剛体マーカーからの終端運動キャプチャ
- Authors: Hai Lan, Zongyan Li, Jianmin Hu, Jialing Yang, Houde Dai,
- Abstract要約: マーカーベースの光モーションキャプチャ(MoCap)は、時間を要する準備やマーカー識別の曖昧さなど、現実的な課題に直面している。
我々は、不明瞭な6-DoFデータを提供するMoCapの新たな基本ユニットであるRigid Body Marker(RBM)を紹介する。
我々は,測地的損失下でSMPLパラメータを直接推定する深層学習に基づく回帰モデルを開発した。
- 参考スコア(独自算出の注目度): 3.8338194488710453
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Marker-based optical motion capture (MoCap), while long regarded as the gold standard for accuracy, faces practical challenges, such as time-consuming preparation and marker identification ambiguity, due to its reliance on dense marker configurations, which fundamentally limit its scalability. To address this, we introduce a novel fundamental unit for MoCap, the Rigid Body Marker (RBM), which provides unambiguous 6-DoF data and drastically simplifies setup. Leveraging this new data modality, we develop a deep-learning-based regression model that directly estimates SMPL parameters under a geodesic loss. This end-to-end approach matches the performance of optimization-based methods while requiring over an order of magnitude less computation. Trained on synthesized data from the AMASS dataset, our end-to-end model achieves state-of-the-art accuracy in body pose estimation. Real-world data captured using a Vicon optical tracking system further demonstrates the practical viability of our approach. Overall, the results show that combining sparse 6-DoF RBM with a manifold-aware geodesic loss yields a practical and high-fidelity solution for real-time MoCap in graphics, virtual reality, and biomechanics.
- Abstract(参考訳): マーカベースの光学モーションキャプチャ(MoCap)は、長い間、正確性のための金の標準と考えられてきたが、そのスケーラビリティを根本的に制限する密度の高いマーカ構成に依存しているため、時間を要する準備やマーカー識別の曖昧さといった実践的な課題に直面している。
そこで本研究では,MoCapの基本ユニットであるRigid Body Marker (RBM)を導入し,不明瞭な6-DoFデータを提供し,セットアップを大幅に単純化する。
新たなデータモダリティを活用することで,測地損失下でのSMPLパラメータを直接推定する深層学習に基づく回帰モデルを構築する。
このエンドツーエンドのアプローチは、最適化ベースのメソッドのパフォーマンスに匹敵するが、桁違いに少ない計算を必要とする。
AMASSデータセットから合成されたデータに基づいて、私たちのエンドツーエンドモデルは、ボディポーズ推定における最先端の精度を達成する。
Vicon光トラッキングシステムを用いて実世界のデータをキャプチャすることで、我々のアプローチの実用性をさらに実証する。
その結果,6-DoF RBMと多様体を意識した測地損失を組み合わせることで,グラフィック,仮想現実,バイオメカニクスにおけるリアルタイムMoCapの実用的で高忠実な解が得られることがわかった。
関連論文リスト
- GEM+: Scalable State-of-the-Art Private Synthetic Data with Generator Networks [9.432150710329607]
本稿では,AIMの適応計測フレームワークとGEMのスケーラブルなジェネレータネットワークを統合したGEM+を紹介する。
実験の結果,GEM+はAIMよりも実用性とスケーラビリティに優れ,最先端の成果が得られていることがわかった。
論文 参考訳(メタデータ) (2025-11-12T19:18:43Z) - MEG-GPT: A transformer-based foundation model for magnetoencephalography data [6.336623115095147]
近年のディープラーニングの進歩は、言語や視覚などの他の領域において、大規模に基礎モデルを使用することで、大きな進歩をもたらした。
本稿では,時間アテンションと次の時間ポイント予測を用いたトランスフォーマーベース基盤モデルMEG-GPTを紹介する。
我々は大規模なMEGデータセットから抽出したトークン化された脳領域の時間軸についてMEG-GPTを訓練した。
論文 参考訳(メタデータ) (2025-10-20T20:18:38Z) - Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - DVLO4D: Deep Visual-Lidar Odometry with Sparse Spatial-temporal Fusion [28.146811420532455]
DVLO4Dは,空間-時空間融合を利用して精度とロバスト性を向上する新しい視覚-LiDARオドメトリーフレームワークである。
提案手法は,82msの予測時間を持つ高効率で,実時間展開の可能性を秘めている。
論文 参考訳(メタデータ) (2025-09-07T11:43:11Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - LSM-2: Learning from Incomplete Wearable Sensor Data [65.58595667477505]
本稿では,Adaptive and Inherited Masking (AIM)を用いた第2世代Large Sensor Model (LSM-2)を紹介する。
AIMは明示的な計算を必要とせず、不完全なデータから直接堅牢な表現を学習する。
AIMを用いた LSM-2 は, 分類, 回帰, 生成モデルなど, 多様なタスクにまたがる最高の性能を実現する。
論文 参考訳(メタデータ) (2025-06-05T17:57:11Z) - RefiDiff: Refinement-Aware Diffusion for Efficient Missing Data Imputation [13.401822039640297]
高次元混合型データセットの欠落値は、データ計算に重大な課題をもたらす。
本稿では,ローカルな機械学習予測と,新しいマンバベースの認知ネットワークを組み合わせた,革新的なフレームワークRefiDiffを提案する。
RefiDiffは、DDPMベースのアプローチよりも4倍高速なトレーニング時間で、不足値設定でステート・ザ・アート(SOTA)メソッドをパフォーマンスします。
論文 参考訳(メタデータ) (2025-05-20T14:51:07Z) - Sparse identification of nonlinear dynamics and Koopman operators with Shallow Recurrent Decoder Networks [3.1484174280822845]
本稿では, 簡易な実装, 効率的, 堅牢な性能で, センサとモデル識別の問題を共同で解決する手法を提案する。
SINDy-SHREDはGated Recurrent Unitsを使用してスパースセンサー計測と浅いネットワークデコーダをモデル化し、潜在状態空間からフルタイムフィールドを再構築する。
本研究では, 乱流, 海面温度の実環境センサ計測, 直接ビデオデータなどのPDEデータに関する系統的研究を行った。
論文 参考訳(メタデータ) (2025-01-23T02:18:13Z) - AdaSfM: From Coarse Global to Fine Incremental Adaptive Structure from
Motion [48.835456049755166]
AdaSfMは粗粒度適応型SfMアプローチであり、大規模かつ挑戦的なデータセットにスケーラブルである。
当社のアプローチはまず,低コストセンサによる計測を利用して,ビューグラフの信頼性を向上させる,粗大なグローバルSfMを実現する。
本手法では,全局所再構成をグローバルSfMの座標フレームに整合させるため,しきい値適応戦略を用いる。
論文 参考訳(メタデータ) (2023-01-28T09:06:50Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。