論文の概要: RoMo: A Robust Solver for Full-body Unlabeled Optical Motion Capture
- arxiv url: http://arxiv.org/abs/2410.02788v1
- Date: Wed, 18 Sep 2024 02:39:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-03 05:44:23.647284
- Title: RoMo: A Robust Solver for Full-body Unlabeled Optical Motion Capture
- Title(参考訳): RoMo:フルボディの光学式モーションキャプチャー用ロバスト・ソルバー
- Authors: Xiaoyu Pan, Bowen Zheng, Xinwei Jiang, Zijiao Zeng, Qilong Kou, He Wang, Xiaogang Jin,
- Abstract要約: 我々は、生の光学的モーションキャプチャデータを堅牢にラベル付けし、解決するための学習ベースのフレームワークであるRoMoを紹介する。
ラベル付けの段階では、RoMoは、複雑なフルボディラベリングチャレンジを管理可能なサブタスクに分解するために、分割・コンカ戦略を採用している。
運動解法では, 運動連鎖に沿った誤差蓄積を防止するために, ハイブリッド逆運動解法を導入する。
- 参考スコア(独自算出の注目度): 16.10793235070616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optical motion capture (MoCap) is the "gold standard" for accurately capturing full-body motions. To make use of raw MoCap point data, the system labels the points with corresponding body part locations and solves the full-body motions. However, MoCap data often contains mislabeling, occlusion and positional errors, requiring extensive manual correction. To alleviate this burden, we introduce RoMo, a learning-based framework for robustly labeling and solving raw optical motion capture data. In the labeling stage, RoMo employs a divide-and-conquer strategy to break down the complex full-body labeling challenge into manageable subtasks: alignment, full-body segmentation and part-specific labeling. To utilize the temporal continuity of markers, RoMo generates marker tracklets using a K-partite graph-based clustering algorithm, where markers serve as nodes, and edges are formed based on positional and feature similarities. For motion solving, to prevent error accumulation along the kinematic chain, we introduce a hybrid inverse kinematic solver that utilizes joint positions as intermediate representations and adjusts the template skeleton to match estimated joint positions. We demonstrate that RoMo achieves high labeling and solving accuracy across multiple metrics and various datasets. Extensive comparisons show that our method outperforms state-of-the-art research methods. On a real dataset, RoMo improves the F1 score of hand labeling from 0.94 to 0.98, and reduces joint position error of body motion solving by 25%. Furthermore, RoMo can be applied in scenarios where commercial systems are inadequate. The code and data for RoMo are available at https://github.com/non-void/RoMo.
- Abstract(参考訳): 光モーションキャプチャ(MoCap)は、全身の動きを正確に捉えるための「金の標準」である。
生のMoCapポイントデータを利用するために、システムは対応する身体部分位置のポイントをラベル付けし、全体動作を解決する。
しかし、MoCapのデータには、しばしば不正なラベル付け、隠蔽、位置誤差が含まれており、広範囲な手作業による修正が必要である。
この負担を軽減するために、生の光学的モーションキャプチャデータを堅牢にラベル付けし、解決するための学習ベースのフレームワークであるRoMoを導入する。
ラベリングの段階では、RoMoは、複雑なフルボディラベリングの課題を、アライメント、フルボディセグメンテーション、パート固有ラベリングといった管理可能なサブタスクに分解するために、ディバイス・アンド・コンカー戦略を採用している。
マーカーの時間的連続性を利用するため、RoMoはK-partiteグラフに基づくクラスタリングアルゴリズムを用いてマーカートラッカーを生成し、マーカーがノードとして機能し、エッジは位置的および特徴的類似性に基づいて形成される。
運動解法では, 運動連鎖に沿った誤差蓄積を防止するために, 関節位置を中間表現として利用し, テンプレートスケルトンを推定関節位置に合わせて調整するハイブリッド逆運動解法を導入する。
複数のメトリクスやさまざまなデータセットにまたがって,高いラベル付けと高精度化を実現していることを実証する。
大規模比較の結果,本手法は最先端の研究方法よりも優れていた。
実際のデータセットでは、RoMoは手札のF1スコアを0.94から0.98に改善し、体の動き解決の関節位置誤差を25%低減する。
さらに、商用システムが不十分なシナリオにRoMoを適用することもできる。
RoMoのコードとデータはhttps://github.com/non-void/RoMoで入手できる。
関連論文リスト
- Weak Supervision with Arbitrary Single Frame for Micro- and Macro-expression Spotting [22.04975008531069]
本稿では,各表現を1つのランダムフレーム(すなわち1点)でアノテートする必要がある点レベルの弱教師付き表現スポッティングフレームワークを提案する。
我々は,MPLGがクラス固有の確率,注意スコア,融合特徴,点レベルのラベルを融合することにより,より信頼性の高い擬似ラベルを生成することを示す。
CAS(ME)2、CAS(ME)3、SAMM-LVデータセットの実験は、PWESが最近の完全教師付き手法に匹敵する有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2024-03-21T09:01:21Z) - A Locality-based Neural Solver for Optical Motion Capture [37.28597049192196]
ノイズの多いマーカーデータから、マーカーと関節を異なるタイプのノードとして扱う異種グラフニューラルネットワークを提案する。
本手法は,隠蔽マーカー位置誤差の予測精度の観点から,最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-09-01T12:40:17Z) - Self-Adaptive Label Augmentation for Semi-supervised Few-shot
Classification [121.63992191386502]
Few-shotの分類は、ラベル付きサンプルがわずかにあれば、新しいタスクをうまく一般化できるモデルを学ぶことを目的としている。
そこで本研究では,手動で定義した指標を用いて,ラベルのない各サンプルに適切なラベルを割り当てる半教師付き小ショット分類手法を提案する。
SALAの目新しいところは、タスク適応計量であり、エンドツーエンドの方法で異なるタスクに対するメトリックを適応的に学習することができる。
論文 参考訳(メタデータ) (2022-06-16T13:14:03Z) - MGH: Metadata Guided Hypergraph Modeling for Unsupervised Person
Re-identification [18.837355859638365]
教師なしのReIDは、ラベル付き情報を必要としないクエリイメージと同一のIDを一致させることを目的としている。
メタ情報を用いて特徴学習とラベルリファインメントのためのハイパーグラフを構築する新しい人物ReIDアプローチであるtextbfMGHを提案する。
論文 参考訳(メタデータ) (2021-10-12T10:55:13Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - Coping with Label Shift via Distributionally Robust Optimisation [72.80971421083937]
分散ロバスト最適化(DRO)に基づく目的最小化モデルを提案する。
そこで我々は,提案した目的を最適化するために,大規模問題に適した勾配降下近位ミラー上昇アルゴリズムを設計し,解析する。
論文 参考訳(メタデータ) (2020-10-23T08:33:04Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。