論文の概要: Tipiano: Cascaded Piano Hand Motion Synthesis via Fingertip Priors
- arxiv url: http://arxiv.org/abs/2604.09692v1
- Date: Mon, 06 Apr 2026 15:04:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.598448
- Title: Tipiano: Cascaded Piano Hand Motion Synthesis via Fingertip Priors
- Title(参考訳): Tipiano: Fingertipによるピアノハンドモーション合成
- Authors: Joonhyung Bae, Kirak Kim, Hyeyoon Cho, Sein Lee, Yoon-Seok Choi, Hyeon Hur, Gyubin Lee, Akira Maezawa, Satoshi Obata, Jonghwa Park, Jaebum Park, Juhan Nam,
- Abstract要約: ピアノの動きは自然な階層を示しており、指先の位置はピアノの幾何学と指先によってほぼ決定的であり、手首と中間の関節は様式的な自由を提供する。
統計に基づく指先位置決め,FiLM条件による軌道修正,手首推定などを含む,この階層を利用した4段階のフレームワークを提案する。
- 参考スコア(独自算出の注目度): 13.063302264614057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthesizing realistic piano hand motions requires both precision and naturalness. Physics-based methods achieve precision but produce stiff motions; data-driven models learn natural dynamics but struggle with positional accuracy. Piano motion exhibits a natural hierarchy: fingertip positions are nearly deterministic given piano geometry and fingering, while wrist and intermediate joints offer stylistic freedom. We present [OURS], a four-stage framework exploiting this hierarchy: (1) statistics-based fingertip positioning, (2) FiLM-conditioned trajectory refinement, (3) wrist estimation, and (4) STGCN-based pose synthesis. We contribute expert-annotated fingerings for the FürElise dataset (153 pieces, ~10 hours). Experiments demonstrate F1 = 0.910, substantially outperforming diffusion baselines (F1 = 0.121), with user study (N=41) confirming quality approaching motion capture. Expert evaluation by professional pianists (N=5) identified anticipatory motion as the key remaining gap, providing concrete directions for future improvement.
- Abstract(参考訳): 現実的なピアノの手の動きを合成するには、正確さと自然さの両方が必要である。
データ駆動型モデルは自然力学を学習するが、位置精度に苦しむ。
ピアノの動きは自然な階層を示しており、指先の位置はピアノの幾何学と指先によってほぼ決定的であり、手首と中間関節は様式的な自由を提供する。
1)統計に基づく指先位置決め,(2)FiLM条件による軌道修正,(3)手首推定,(4)STGCNに基づくポーズ合成,である。
FürEliseデータセット (153ピース, 約10時間) に対して, 専門家によるフィンガープリントに貢献する。
実験では、F1 = 0.910が拡散ベースライン(F1 = 0.121)を大幅に上回り、ユーザスタディ(N=41)は、モーションキャプチャーに近づく品質を確認する。
プロのピアニスト (N=5) による専門家による評価では, 予測運動が重要な残差であり, 今後の改善に向けた具体的な方向性が示された。
関連論文リスト
- HandX: Scaling Bimanual Motion and Interaction Generation [55.486397101415]
HandXはデータ、アノテーション、評価にまたがる統一された基盤である。
既存のデータセットを統合・フィルタリングし、新しいモーションキャプチャーデータセットを収集します。
新たに提案した手中心の指標によって支援された高品質なデキスタラスモーション生成実験を行った。
論文 参考訳(メタデータ) (2026-03-30T17:59:49Z) - PHANTOM Hand [12.871356369910323]
腱駆動不動手は適応的握力では優れるが、運動的不予測性や非作動力伝達に悩まされることが多い。
PHANTOM Hand (Hybrid Precision-Augmented Compliance) は6つのアクチュエータと15自由度(DoF)を備えたモジュラー・ヒューマンスケールシステムである。
本稿では,正確な解析的形状と頑健な整合性把握のギャップを埋める統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2026-03-24T12:52:18Z) - HandelBot: Real-World Piano Playing via Fast Adaptation of Dexterous Robot Policies [32.80504141722999]
HandelBotは、シミュレーションポリシと、2段階のパイプラインによる迅速な適応を組み合わせたフレームワークである。
我々はHandelBotが正確にバイマニュアルピアノを演奏できることを実証した。
本システムでは, 直接シミュレーションの展開を1.8倍に向上させ, 30分間の物理的相互作用データを必要とする。
論文 参考訳(メタデータ) (2026-03-12T17:56:29Z) - PianoVAM: A Multimodal Piano Performance Dataset [56.318475235705954]
PianoVAMは、ビデオ、オーディオ、MIDI、手のランドマーク、指のラベル、リッチメタデータを含む包括的なピアノパフォーマンスデータセットである。
データセットはディクラヴィエピアノを使用して録音され、アマチュアピアニストの日々の練習セッション中にオーディオとMIDIをキャプチャした。
事前訓練されたポーズ推定モデルと半自動指先アノテーションアルゴリズムを用いて,手指のランドマークと指先ラベルを抽出した。
論文 参考訳(メタデータ) (2025-09-10T17:35:58Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - FürElise: Capturing and Physically Synthesizing Hand Motions of Piano Performance [15.909113091360206]
ピアノ演奏を正確に再現する洗練された手の動きモデルは、キャラクターアニメーション、エンボディAI、バイオメカニクス、VR/ARに幅広い応用がある。
本稿では,153曲のクラシック音楽を演奏する15人のエリートレベルのピアニストによる,約10時間の3D手の動きとオーディオを含む,第1世代の大規模データセットを構築する。
論文 参考訳(メタデータ) (2024-10-08T08:21:05Z) - RP1M: A Large-Scale Motion Dataset for Piano Playing with Bi-Manual Dexterous Robot Hands [57.64308229980045]
ロボットピアノ100万のデータセットには,100万回以上の軌跡の動作データをバイマニュアルで演奏するロボットピアノが組み込まれている。
指の配置を最適な移動問題として定式化し、大量の未収録曲の自動アノテーションを可能にする。
既存の模倣学習手法のベンチマークでは、RP1Mを活用することにより、最先端のロボットピアノ演奏性能に達することが示されている。
論文 参考訳(メタデータ) (2024-08-20T17:56:52Z) - PianoMotion10M: Dataset and Benchmark for Hand Motion Generation in Piano Performance [15.21347897534943]
ピアノ演奏のための手の動きと指の動きをガイドするピアノハンド動作生成ベンチマークを構築した。
この目的のために,1000万個の手ポーズを持つ鳥眼ビューから116時間のピアノ演奏ビデオからなる注釈付きデータセットPianoMotion10Mを収集した。
論文 参考訳(メタデータ) (2024-06-13T17:05:23Z) - A Skeleton-Driven Neural Occupancy Representation for Articulated Hands [49.956892429789775]
Hand ArticuLated Occupancy (HALO) は、3Dキーポイントと神経暗黙の面の利点を橋渡しする手話の表現である。
本研究では,3次元物体を把握した手の条件生成作業に対するHALOの適用性を示す。
論文 参考訳(メタデータ) (2021-09-23T14:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。