論文の概要: HumanScore: Benchmarking Human Motions in Generated Videos
- arxiv url: http://arxiv.org/abs/2604.20157v1
- Date: Wed, 22 Apr 2026 03:51:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.95623
- Title: HumanScore: Benchmarking Human Motions in Generated Videos
- Title(参考訳): HumanScore: 生成されたビデオで人間の動きをベンチマークする
- Authors: Yusu Fang, Tiange Xiang, Tian Tan, Narayan Schuetz, Scott Delp, Li Fei-Fei, Ehsan Adeli,
- Abstract要約: AI生成ビデオにおける人間の動きの質を評価するためのフレームワークであるHumanScoreを提案する。
HumanScoreは、6つの解釈可能なメトリクスを定義している。
解析の結果,知覚の可塑性と運動の生体力学的忠実度との間には一貫したギャップが認められた。
- 参考スコア(独自算出の注目度): 16.29197573772623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in model architectures, compute, and data scale have driven rapid progress in video generation, producing increasingly realistic content. Yet, no prior method systematically measures how faithfully these systems render human bodies and motion dynamics. In this paper, we present HumanScore, a systematic framework to evaluate the quality of human motions in AI-generated videos. HumanScore defines six interpretable metrics spanning kinematic plausibility, temporal stability, and biomechanical consistency, enabling fine-grained diagnosis beyond visual realism alone. Through carefully designed prompts, we elicit a diverse set of movements at varying intensities and evaluate videos generated by thirteen state-of-the-art models. Our analysis reveals consistent gaps between perceptual plausibility and motion biomechanical fidelity, identifies recurrent failure modes (e.g., temporal jitter, anatomically implausible poses, and motion drift), and produces robust model rankings from quantitative and physically meaningful criteria.
- Abstract(参考訳): モデルアーキテクチャ、計算、データスケールの最近の進歩は、ビデオ生成の急速な進歩をもたらし、ますます現実的なコンテンツを生み出している。
しかし、これらのシステムがいかに人間の身体や運動力学を忠実に表現するかを体系的に測定する以前の手法は存在しない。
本稿では,AI生成ビデオにおける人間の動きの質を評価するための体系的フレームワークであるHumanScoreを提案する。
HumanScoreは、6つの解釈可能なメトリクスを定義している。
慎重に設計されたプロンプトを通じて、様々な強度の様々な動きを抽出し、13の最先端モデルによって生成された映像を評価する。
本分析では, 知覚的可塑性と運動力学的忠実度の間に一貫したギャップを明らかにし, 繰り返し発生する故障モード(例えば, 時間的ジッタ, 解剖学的に不明瞭なポーズ, 動きのドリフト)を同定し, 定量的, 物理的に有意な基準からロバストなモデルランキングを生成する。
関連論文リスト
- Physion-Eval: Evaluating Physical Realism in Generated Video via Human Reasoning [77.34919361116037]
ビデオ生成モデルは、ストーリーテリング、シミュレーション、エンボディドAIのための世界シミュレータとして、ますます使われている。
既存の評価は、自動化されたメトリクスや、好みやルーリックベースのチェックのような粗い人間の判断に大きく依存している。
5つの最先端モデルによって生成されたビデオにおいて、物理的リアリズムの失敗を診断するための専門家による推論のベンチマークであるPhyllon-Evalを紹介する。
論文 参考訳(メタデータ) (2026-03-20T03:25:41Z) - MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction [54.36564144414704]
MeshMimicは、3Dシーンの再構築とインテリジェンスを組み込んだ革新的なフレームワークで、ヒューマノイドロボットがビデオから直接「モーション・テライン」インタラクションを学習できるようにする。
現状の3次元視覚モデルを活用することで、我々のフレームワークは、人間の軌跡と基礎となる地形や物体の3次元幾何学の両方を正確にセグメント化し再構築する。
論文 参考訳(メタデータ) (2026-02-17T17:09:45Z) - Generative Action Tell-Tales: Assessing Human Motion in Synthesized Videos [4.872114804382539]
実世界の人間の行動の学習された潜在空間から導かれる新しい評価基準を導入する。
本手法は、外見に依存しない人間の骨格幾何学的特徴と外見に基づく特徴を融合させることにより、実世界の動きのニュアンス、制約、時間的滑らかさをまず捉える。
生成した映像から,この学習された実世界の行動分布との距離を計測することにより,その行動の質を定量化する。
論文 参考訳(メタデータ) (2025-12-01T15:36:33Z) - Biomechanics-Guided Residual Approach to Generalizable Human Motion Generation and Estimation [21.750804738752105]
3つの中心となるイノベーションを持つバイオメカニック・アウェア・フレームワークであるBioVAEを提案する。
複数のベンチマークにおいて,BioVAEが最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2025-03-08T10:22:36Z) - Aligning Human Motion Generation with Human Perceptions [51.831338643012444]
本研究では,大規模人間の知覚評価データセットであるMotionPerceptと,人間の動作批判モデルであるMotionCriticを導入することにより,ギャップを埋めるデータ駆動型アプローチを提案する。
我々の批評家モデルは、運動品質を評価するためのより正確な指標を提供しており、容易に運動生成パイプラインに統合することができる。
論文 参考訳(メタデータ) (2024-07-02T14:01:59Z) - 3D Kinematics Estimation from Video with a Biomechanical Model and
Synthetic Training Data [4.130944152992895]
2つの入力ビューから3Dキネマティクスを直接出力するバイオメカニクス対応ネットワークを提案する。
実験により, 提案手法は, 合成データにのみ訓練されたものであり, 従来の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-20T17:33:40Z) - Skeleton2Humanoid: Animating Simulated Characters for
Physically-plausible Motion In-betweening [59.88594294676711]
現代の深層学習に基づく運動合成アプローチは、合成された運動の物理的妥当性をほとんど考慮していない。
テスト時に物理指向の動作補正を行うシステムSkeleton2Humanoid'を提案する。
挑戦的なLaFAN1データセットの実験は、物理的妥当性と精度の両方の観点から、我々のシステムが先行手法を著しく上回っていることを示している。
論文 参考訳(メタデータ) (2022-10-09T16:15:34Z) - Learning Local Recurrent Models for Human Mesh Recovery [50.85467243778406]
本稿では,人間のメッシュを標準的な骨格モデルに従って複数の局所的に分割するビデオメッシュ復元手法を提案する。
次に、各局所部分の力学を別個のリカレントモデルでモデル化し、各モデルは、人体の既知の運動構造に基づいて適切に条件付けする。
これにより、構造的インフォームドな局所的再帰学習アーキテクチャが実現され、アノテーションを使ってエンドツーエンドでトレーニングすることができる。
論文 参考訳(メタデータ) (2021-07-27T14:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。