Fugu-MT 論文翻訳(概要): Piano Skills Assessment

論文の概要: Piano Skills Assessment

arxiv url: http://arxiv.org/abs/2101.04884v1
Date: Wed, 13 Jan 2021 05:26:29 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-03 20:52:18.338600
Title: Piano Skills Assessment
Title（参考訳）: ピアノスキル評価
Authors: Paritosh Parmar, Jaiden Reddy, Brendan Morris
Abstract要約: ピアノ奏者のスキルレベル評価に焦点を当てたマルチモーダルスキルアセスメントのための先駆的なデータセットを収集・公開します。ピアノ演奏スキルの自動評価作業を開始し,今後の作業のベースラインを提供する。
参考スコア（独自算出の注目度）: 3.867363075280544
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Can a computer determine a piano player's skill level? Is it preferable to base this assessment on visual analysis of the player's performance or should we trust our ears over our eyes? Since current CNNs have difficulty processing long video videos, how can shorter clips be sampled to best reflect the players skill level? In this work, we collect and release a first-of-its-kind dataset for multimodal skill assessment focusing on assessing piano player's skill level, answer the asked questions, initiate work in automated evaluation of piano playing skills and provide baselines for future work.
Abstract（参考訳）: コンピュータはピアノ奏者のスキルレベルを決定できるのか? この評価を選手のパフォーマンスの視覚的分析に基づくのが望ましいのか、それとも耳を目の上から信頼すべきなのか。現在のCNNは長いビデオの処理が難しいので、どのようにして短いクリップをサンプリングしてプレイヤーのスキルレベルを最もよく反映できるか? 本研究では,ピアノ演奏者のスキルレベル評価に着目したマルチモーダルスキル評価のための初歩的なデータセットを収集,リリースし,質問に答え,ピアノ演奏スキルの自動評価作業を開始するとともに,今後の作業のベースラインを提供する。

関連論文リスト

Who is a Better Player: LLM against LLM [53.46608216197315]
本稿では,大規模言語モデル (LLM) の総合的な性能を評価するための対戦型ベンチマークフレームワークを提案する。広範にプレイされている5つのゲームをサポートし,20のLDMを駆使したプレーヤーを対象とする,特別な評価プラットフォームであるQi Townを紹介した。
論文参考訳（メタデータ） (2025-08-05T06:41:47Z)
Skill Issues: An Analysis of CS:GO Skill Rating Systems [0.24578723416255746]
Elo、Glicko2、TrueSkillは代理モデリングのレンズを通して研究されている。我々は、全体的な性能とデータ効率を考察し、Counter-Strike: Global Offensive Matchの大規模なデータセットに基づいて感度分析を行う。
論文参考訳（メタデータ） (2024-10-01T23:19:31Z)
ExpertAF: Expert Actionable Feedback from Video [81.46431188306397]
本研究では,身体活動を行う人の映像から行動可能なフィードバックを生成する新しい手法を提案する。提案手法は,映像のデモンストレーションとそれに伴う3Dボディーポーズを取り,専門家による解説を生成する。提案手法は,マルチモーダルな入力の組み合わせを解析し,フルスペクトルで実用的なコーチングを出力することができる。
論文参考訳（メタデータ） (2024-08-01T16:13:07Z)
Towards Explainable and Interpretable Musical Difficulty Estimation: A Parameter-efficient Approach [49.2787113554916]
音楽コレクションの整理には曲の難易度を推定することが重要である。シンボリックな音楽表現の難易度推定には説明可能な記述子を用いる。ピアノレパートリーで評価したアプローチは,平均2乗誤差(MSE)が1.7。
論文参考訳（メタデータ） (2024-08-01T11:23:42Z)
PianoMime: Learning a Generalist, Dexterous Piano Player from Internet Demonstrations [21.52466727496551]
インターネットデモを用いたピアノ演奏エージェントのトレーニングフレームワークであるPianoMimeを紹介した。本研究では,任意の曲を演奏できるジェネラリストピアノ演奏エージェントを学習するために,これらのデモを活用している。我々は、目に見えない曲でF1スコアの最大56%のポリシーを学習できることを示します。
論文参考訳（メタデータ） (2024-07-25T16:37:07Z)
An Order-Complexity Model for Aesthetic Quality Assessment of Symbolic Homophony Music Scores [8.751312368054016]
AIが生み出す音楽の質は、人間の作曲家が生み出すものに比べれば比較的劣っている。本稿では,ホモフォニー楽譜の美的品質評価のための客観的定量的評価法を提案する。
論文参考訳（メタデータ） (2023-01-14T12:30:16Z)
MERLOT Reserve: Neural Script Knowledge through Vision and Language and Sound [90.1857707251566]
MERLOT Reserveは、時間とともに動画を共同で表現するモデルである。我々は、テキストとオーディオのスニペットをMASKトークンに置き換え、正しいマスクアウトスニペットを選択して学習する。私たちの目標は代替手段よりも早く学習し、大規模に機能します。
論文参考訳（メタデータ） (2022-01-07T19:00:21Z)
Evaluating Team Skill Aggregation in Online Competitive Games [4.168733556014873]
本稿では,2つの新しい集計手法が評価システムの予測性能に与える影響について分析する。以上の結果から,テストケースの大部分において,MAX法が他の2手法よりも優れていることが示された。本研究の結果は,チームのパフォーマンスを計算するために,より精巧な手法を考案する必要性を浮き彫りにした。
論文参考訳（メタデータ） (2021-06-21T20:17:36Z)
Towards Learning to Play Piano with Dexterous Hands and Touch [79.48656721563795]
そこで我々は,エージェントが機械可読音楽から直接学習して,模擬ピアノで器用な手でピアノを弾く方法を示した。我々は、タッチ強化された報酬と、新しいタスクのカリキュラムを使用することで、これを実現する。
論文参考訳（メタデータ） (2021-06-03T17:59:31Z)
An Empirical Study on the Generalization Power of Neural Representations Learned via Visual Guessing Games [79.23847247132345]
本研究は,視覚質問応答(VQA)のような新しいNLP下流タスクにおいて,後から実行を依頼されたとき,人工エージェントが推測ゲームでどの程度の利益を得ることができるかを検討する。提案手法は,1) エージェントがうまく推理ゲームを模倣することを学習する教師あり学習シナリオ,2) エージェントが単独でプレイする新しい方法,すなわち,反復経験学習(SPIEL)によるセルフプレイ(Self-play)を提案する。
論文参考訳（メタデータ） (2021-01-31T10:30:48Z)
Multi-Modal Music Information Retrieval: Augmenting Audio-Analysis with Visual Computing for Improved Music Video Analysis [91.3755431537592]
この論文は、音声分析とコンピュータビジョンを組み合わせて、マルチモーダルの観点から音楽情報検索(MIR)タスクにアプローチする。本研究の主な仮説は、ジャンルやテーマなど特定の表現的カテゴリーを視覚的内容のみに基づいて認識できるという観察に基づいている。実験は、3つのMIRタスクに対して行われ、アーティスト識別、音楽ジェネア分類、クロスジェネア分類を行う。
論文参考訳（メタデータ） (2020-02-01T17:57:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。