論文の概要: Geometry-Aware Losses for Structure-Preserving Text-to-Sign Language Generation
- arxiv url: http://arxiv.org/abs/2509.23011v1
- Date: Sat, 27 Sep 2025 00:06:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:18.98295
- Title: Geometry-Aware Losses for Structure-Preserving Text-to-Sign Language Generation
- Title(参考訳): 構造保存型テキスト-手話生成のための幾何学的認識損失
- Authors: Zetian Wu, Tianshuo Zhou, Stefan Lee, Liang Huang,
- Abstract要約: 手話翻訳は、難聴者や難聴者に対して効果的なコミュニケーションを可能にする上で重要な役割を担っている。
以前の手法では、人間の骨格運動の解剖学的制約や調整パターンを無視することが多かった。
骨格関節間の関係を明示的にモデル化する新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 14.94145299705437
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Sign language translation from text to video plays a crucial role in enabling effective communication for Deaf and hard--of--hearing individuals. A major challenge lies in generating accurate and natural body poses and movements that faithfully convey intended meanings. Prior methods often neglect the anatomical constraints and coordination patterns of human skeletal motion, resulting in rigid or biomechanically implausible outputs. To address this, we propose a novel approach that explicitly models the relationships among skeletal joints--including shoulders, arms, and hands--by incorporating geometric constraints on joint positions, bone lengths, and movement dynamics. During training, we introduce a parent-relative reweighting mechanism to enhance finger flexibility and reduce motion stiffness. Additionally, bone-pose losses and bone-length constraints enforce anatomically consistent structures. Our method narrows the performance gap between the previous best and the ground-truth oracle by 56.51%, and further reduces discrepancies in bone length and movement variance by 18.76% and 5.48%, respectively, demonstrating significant gains in anatomical realism and motion naturalness.
- Abstract(参考訳): テキストからビデオへの手話翻訳は、難聴者や難聴者に対する効果的なコミュニケーションを可能にする上で重要な役割を担っている。
大きな課題は、意図した意味を忠実に伝える正確で自然なポーズや動きを生み出すことである。
以前の手法は、人間の骨格運動の解剖学的制約や調整パターンを無視し、硬直的または生体力学的に不可解な出力をもたらす。
そこで本稿では, 肩, 腕, 手など骨格関節間の関係を, 関節位置, 骨長, 運動動態に幾何的制約を加えて, 明確にモデル化する手法を提案する。
トレーニング中,指の柔軟性を高め,運動剛性を低下させる親相対リウェイト機構を導入する。
さらに、骨配置の損失と骨長の制約は解剖学的に一貫した構造を強制する。
提案手法は,前回のベストとグラウンド・トゥルース・オーラクルのパフォーマンスギャップを56.51%削減し,骨長と移動の差異を18.76%,5.48%削減し,解剖学的リアリズムと運動自然性において有意な優位性を示した。
関連論文リスト
- Bridging Structural Dynamics and Biomechanics: Human Motion Estimation through Footstep-Induced Floor Vibrations [2.7180946990643466]
既存のアプローチには、カメラ、ウェアラブル、圧力マットなどの監視デバイスが含まれる。
歩行誘発床振動を利用して下肢関節運動を推定する。
本モデルでは,身体と床間の情報共有を可能とし,不確実性を低減するために物理的制約を課す。
論文 参考訳(メタデータ) (2025-02-21T20:10:15Z) - Two-Person Interaction Augmentation with Skeleton Priors [16.65884142618145]
本稿では,2体インタラクション運動増強のための新しい深層学習法を提案する。
我々のシステムは比較的少量のデータから効果的に学習でき、骨格サイズが大幅に異なるように一般化できる。
論文 参考訳(メタデータ) (2024-04-08T13:11:57Z) - InterControl: Zero-shot Human Interaction Generation by Controlling Every Joint [67.6297384588837]
関節間の所望距離を維持するために,新しい制御可能な運動生成手法であるInterControlを導入する。
そこで本研究では,既成の大規模言語モデルを用いて,ヒューマンインタラクションのための結合ペア間の距離を生成できることを実証した。
論文 参考訳(メタデータ) (2023-11-27T14:32:33Z) - Learning Realistic Joint Space Boundaries for Range of Motion Analysis of Healthy and Impaired Human Arms [0.5530212768657544]
本研究では,現実的な解剖学的制約のある上層域の運動境界を,モーションキャプチャーデータから学習するためのデータ駆動手法を提案する。
また,健常腕と障害腕の比較において,能力・障害の定量的評価を行う指標(II)を提案する。
論文 参考訳(メタデータ) (2023-11-17T17:14:42Z) - Imposing Temporal Consistency on Deep Monocular Body Shape and Pose
Estimation [67.23327074124855]
本稿では,適合過程における時間的制約の統合に対するエレガントな解法を提案する。
我々は、顎ポーズ、表情、指ポーズを含む人物の形状と動きを表す一連の身体モデルのパラメーターを導出する。
本手法は,表情や手話を含む画像系列からリアルな3次元体モデルの導出を可能にする。
論文 参考訳(メタデータ) (2022-02-07T11:11:55Z) - Towards Understanding the Adversarial Vulnerability of Skeleton-based
Action Recognition [133.35968094967626]
骨格に基づく行動認識は、動的状況への強い適応性から注目を集めている。
ディープラーニング技術の助けを借りて、かなり進歩し、現在、良識のある環境で約90%の精度を達成している。
異なる対角的環境下での骨格に基づく行動認識の脆弱性に関する研究はいまだ研究されていない。
論文 参考訳(メタデータ) (2020-05-14T17:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。