論文の概要: Bézier Degradation Modeling for LiDAR-based Human Motion Capture
- arxiv url: http://arxiv.org/abs/2605.19620v1
- Date: Tue, 19 May 2026 09:56:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 01:01:02.80666
- Title: Bézier Degradation Modeling for LiDAR-based Human Motion Capture
- Title(参考訳): LiDARを用いた人体モーションキャプチャのベジエ劣化モデル
- Authors: Xiaoqi An, Lin Zhao, Jun Li, Chen Gong, Jian Yang,
- Abstract要約: BMLiCapは、時間圧縮可能なベジエ曲線を用いて動きをモデル化する粗大なフレームワークである。
複雑なシーンにおける最先端の精度と時間的連続性を達成する。
- 参考スコア(独自算出の注目度): 21.718401755735773
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LiDAR-based 3D human motion capture has broad applications in fields such as autonomous driving and robotics, where accurate motion reconstruction is crucial. However, existing methods often struggle with unstable inputs and severe occlusions, leading to jittery or even failed pose predictions. To address these challenges, we propose BMLiCap, a coarse-to-fine framework that models motion using temporally compressible Bézier curves. By reducing control points through a trajectory-preserving strategy, we obtain a coherent and learning-friendly motion representation. To reconstruct human actions from LiDAR point-cloud cues, we design a progressive motion-reconstruction module. Specifically, a Time-scale Motion Transformer (TMT) is introduced to predict motion curves at multiple temporal scales, and a Multi-level Motion Aggregator (MMA) is utilized to adaptively fuse the multi-scale curves to recover detailed, temporally coherent poses, effectively bridging observation gaps caused by occlusions and noise. Across four mainstream benchmarks LiDARHuman26M, FreeMotion, NoiseMotion, and SLOPER4D, BMLiCap achieves state-of-the-art accuracy and temporal continuity in complex scenes, demonstrating its ability to compensate for severe occlusions and reduce prediction jitter.
- Abstract(参考訳): LiDARをベースとした3Dモーションキャプチャーは、正確なモーション再構成が不可欠である自律走行やロボット工学などの分野に広く応用されている。
しかし、既存の手法は不安定な入力や厳密な閉塞に苦しむことが多く、ひどかったり、ポーズの予測に失敗することもあった。
これらの課題に対処するために,時間圧縮可能なベジエ曲線を用いて動きをモデル化する粗粒度フレームワークBMLiCapを提案する。
トラジェクトリ保存戦略により制御点を小さくすることで,一貫性のある,学習に優しい動作表現が得られる。
我々は,LiDARポイントクラウドキューから人間の行動を再構築するために,プログレッシブモーション再構成モジュールを設計する。
具体的には、複数の時間スケールで運動曲線を予測するために、TMT(Time-scale Motion Transformer)を導入し、MMA(Multi-level Motion Aggregator)を用いて、多段階の運動曲線を適応的に融合させて、詳細で時間的に整合したポーズを復元し、閉塞や雑音による観測ギャップを効果的に埋める。
LiDARHuman26M、FreeMotion、NozzMotion、SLOPER4Dの4つの主要なベンチマークにおいて、BMLiCapは複雑なシーンにおける最先端の精度と時間的連続性を達成し、重度の閉塞を補償し、予測ジッタを減らす能力を示している。
関連論文リスト
- Ada3Drift: Adaptive Training-Time Drifting for One-Step 3D Visuomotor Robotic Manipulation [53.750389076941396]
拡散に基づくビジュモータポリシーは反復的認知を通じて多モーダルな動作分布をキャプチャするが、その高い推論遅延はリアルタイムロボット制御を制限する。
Ada3Driftは,専門家のデモモードに対して予測された行動を引き付ける訓練時間ドリフト場を学習する。
Ada3Driftは、拡散ベースの代替よりも10倍の関数評価を必要としながら、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-12T14:36:53Z) - GeoMotion: Rethinking Motion Segmentation via Latent 4D Geometry [61.24189040578178]
そこで本研究では,注目機構を介し,潜在特徴表現から移動対象を直接推論する完全学習型アプローチを提案する。
我々の重要な洞察は、明示的な対応推定を回避し、代わりに、モデルが暗黙的にオブジェクトとカメラの動きを歪めることを学ぶことである。
提案手法は,最先端の動作セグメンテーション性能を高い効率で達成する。
論文 参考訳(メタデータ) (2026-02-25T11:36:33Z) - PEGS: Physics-Event Enhanced Large Spatiotemporal Motion Reconstruction via 3D Gaussian Splatting [8.672740691555736]
PEGSは3D Gaussian Splattingパイプライン内でのイベントストリーム拡張と物理プライオリティを統合するフレームワークである。
本稿では,加速度制約を通した物理的妥当性を強制する3段階の監視手法を提案する。
また、さまざまなデータセットにまたがる自然な高速な動きをターゲットとした、最初のRGB-Eventペアも提供します。
論文 参考訳(メタデータ) (2025-11-21T10:27:51Z) - Real-Time Motion-Controllable Autoregressive Video Diffusion [79.32730467857535]
本稿では,AR-Dragを提案する。このAR-Dragは,多様なモーション制御を備えたリアルタイム画像・ビデオ生成のための,RLで拡張された最初の数ステップのARビデオ拡散モデルである。
まず,基本動作制御をサポートするためのベースI2Vモデルを微調整し,さらに軌道ベース報酬モデルによる強化により改良する。
本設計では、自己学習機構を通じてマルコフ特性を保存し、ステップを選択的に分解することで訓練を加速する。
論文 参考訳(メタデータ) (2025-10-09T12:17:11Z) - PMGS: Reconstruction of Projectile Motion across Large Spatiotemporal Spans via 3D Gaussian Splatting [9.314869696272297]
本研究では,3次元ガウス散乱によるプロジェクタイルの再構成に着目したPMGSを提案する。
本稿では,ニュートン力学を橋渡し,ポーズ推定を行う加速度制約を導入し,運動状態に基づいて学習率を適応的にスケジュールする動的シミュレート変形戦略を設計する。
論文 参考訳(メタデータ) (2025-08-04T17:49:37Z) - EMoTive: Event-guided Trajectory Modeling for 3D Motion Estimation [59.33052312107478]
イベントカメラは、シーン変化に対する連続的適応ピクセルレベル応答による3次元モーション推定の可能性を提供する。
本稿では,イベント誘導パラメトリック曲線を用いた一様軌道をモデル化するイベントベースフレームワークであるEMoveについて述べる。
動作表現には,事象誘導下での空間的特徴と時間的特徴を融合する密度認識適応機構を導入する。
最終3次元運動推定は、パラメトリック軌道、流れ、深度運動場の多時間サンプリングによって達成される。
論文 参考訳(メタデータ) (2025-03-14T13:15:54Z) - CoMoGaussian: Continuous Motion-Aware Gaussian Splatting from Motion-Blurred Images [19.08403715388913]
3D Gaussian Splattingは高品質のノベルビューレンダリングのために注目されている。
重要な問題は、露出中の動きによるカメラの動きのぼかしであり、正確な3Dシーンの復元を妨げる。
動きブル画像から正確な3Dシーンを再構成する連続運動対応ガウス版CoMoGaussianを提案する。
論文 参考訳(メタデータ) (2025-03-07T11:18:43Z) - Motion-adaptive Separable Collaborative Filters for Blind Motion Deblurring [71.60457491155451]
様々な動きによって生じる画像のぼかしを除去することは、難しい問題である。
本研究では,動き適応型分離型協調フィルタと呼ばれる実世界のデブロアリングフィルタモデルを提案する。
本手法は,実世界の動きのぼかし除去に有効な解法を提供し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-04-19T19:44:24Z) - MAT: Motion-Aware Multi-Object Tracking [9.098793914779161]
本稿では,様々な物体の動作パターンに着目した動き認識トラッキング(MAT)を提案する。
MOT16とMOT17の挑戦的なベンチマークの実験は、我々のMATアプローチが大きなマージンで優れたパフォーマンスを達成することを実証している。
論文 参考訳(メタデータ) (2020-09-10T11:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。