論文の概要: Generalizing Sports Feedback Generation by Watching Competitions and Reading Books: A Rock Climbing Case Study
- arxiv url: http://arxiv.org/abs/2602.08996v1
- Date: Mon, 09 Feb 2026 18:41:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.426819
- Title: Generalizing Sports Feedback Generation by Watching Competitions and Reading Books: A Rock Climbing Case Study
- Title(参考訳): 競技会と読書書によるスポーツフィードバック生成の一般化:ロッククライミングケーススタディ
- Authors: Arushi Rai, Adriana Kovashka,
- Abstract要約: ビデオLLMは、スポーツフィードバック生成の困難なタスクに苦労する。
従来のテキスト生成評価指標は、スポーツフィードバックの品質のユニークな側面を捉えていない。
本研究では,(1)特異性と(2)動作可能性の2つの評価指標を提案する。
- 参考スコア(独自算出の注目度): 27.82932642584153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While there is rapid progress in video-LLMs with advanced reasoning capabilities, prior work shows that these models struggle on the challenging task of sports feedback generation and require expensive and difficult-to-collect finetuning feedback data for each sport. This limitation is evident from the poor generalization to sports unseen during finetuning. Furthermore, traditional text generation evaluation metrics (e.g., BLEU-4, METEOR, ROUGE-L, BERTScore), originally developed for machine translation and summarization, fail to capture the unique aspects of sports feedback quality. To address the first problem, using rock climbing as our case study, we propose using auxiliary freely-available web data from the target domain, such as competition videos and coaching manuals, in addition to existing sports feedback from a disjoint, source domain to improve sports feedback generation performance on the target domain. To improve evaluation, we propose two evaluation metrics: (1) specificity and (2) actionability. Together, our approach enables more meaningful and practical generation of sports feedback under limited annotations.
- Abstract(参考訳): 高度な推論能力を持つビデオLLMは急速に進歩しているが、先行研究は、これらのモデルがスポーツフィードバック生成の困難な課題に苦しむことを示しており、各スポーツに対して高価で難しい微調整のフィードバックデータが必要であることを示している。
この制限は、微調整中に目に見えないスポーツへの一般化の低さから明らかである。
さらに、従来のテキスト生成評価指標(例えば、BLEU-4、METEOR、ROUGE-L、BERTScore)は、もともと機械翻訳と要約のために開発されたもので、スポーツフィードバックの品質のユニークな側面を捉えられなかった。
まず,ロッククライミングをケーススタディとして,競技映像やコーチングマニュアルなど,対象領域からのスポーツフィードバックに加えて,対象領域のスポーツフィードバック生成性能を向上させるために,対象領域からの補助的な自由可利用Webデータを利用することを提案する。
評価を改善するために,(1)特異度と(2)動作可能性の2つの評価指標を提案する。
本手法は,限定アノテーションの下でスポーツフィードバックをより有意義かつ実践的に生成することを可能にする。
関連論文リスト
- Learning Skill-Attributes for Transferable Assessment in Video [56.813876909367856]
ビデオによるスキル評価は、人の身体的パフォーマンスの品質を評価し、何がより良くできるかを説明する。
当社のCrossTrainerアプローチでは,バランス,コントロール,手の位置決めといったスキル属性が検出される。
人間のスキルを表わす行動の共有を抽象化することにより,提案した映像表現は,既存のテクニックの配列よりもはるかに優れている。
論文 参考訳(メタデータ) (2025-11-17T23:53:06Z) - SportR: A Benchmark for Multimodal Large Language Model Reasoning in Sports [21.410115837645318]
SportRは、スポーツインテリジェンスに必要な基本的な理由に基づいてMLLMを訓練し、評価するために設計された最初のマルチスポーツ大規模ベンチマークである。
私たちのベンチマークでは,5,017枚の画像と2,101本のビデオのデータセットが提供されている。
罰則の決定や戦術の説明など,多段階の推論を必要とする最も先進的なタスクに対して,我々は7,118の高品質な人間による思考の連鎖(Chain of Thought)アノテーションを提供する。
論文 参考訳(メタデータ) (2025-11-09T18:55:20Z) - FineQuest: Adaptive Knowledge-Assisted Sports Video Understanding via Agent-of-Thoughts Reasoning [10.942503187642851]
FineQuestは、認知科学にインスパイアされたデュアルモード推論を活用する最初のトレーニング不要のフレームワークである。
FineQuestには、9つのスポーツにまたがるマルチモーダルスポーツ知識グラフであるSSGraphが組み込まれている。
Gym-QA と Diving-QA という,FinGym と FineDiving のデータセットから得られた2つの新しいスポーツビデオQAベンチマークを紹介した。
論文 参考訳(メタデータ) (2025-09-15T11:27:23Z) - MatchTime: Towards Automatic Soccer Game Commentary Generation [52.431010585268865]
観客の視聴体験を改善するために,自動サッカーゲーム解説モデルの構築を検討する。
まず、既存のデータセットでよく見られるビデオテキストのミスアライメントを観察し、49試合のタイムスタンプを手動でアノテートする。
第2に,既存のデータセットを自動的に修正・フィルタリングするマルチモーダル時間アライメントパイプラインを提案する。
第3に、キュレートされたデータセットに基づいて、MatchVoiceという自動コメント生成モデルをトレーニングします。
論文 参考訳(メタデータ) (2024-06-26T17:57:25Z) - Sports Intelligence: Assessing the Sports Understanding Capabilities of Language Models through Question Answering from Text to Video [5.885902974241053]
複雑なスポーツシナリオに対する推論は、現在のNLP技術にとって大きな課題となっている。
我々の評価は、基本的なルールや歴史的事実に関する単純なクエリから、複雑な文脈固有の推論まで多岐にわたる。
既存のスポーツデータセットの包括的概要に基づく新しいベンチマークを提案し,広範なエラー解析を行った。
論文 参考訳(メタデータ) (2024-06-21T05:57:50Z) - Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex and Professional Sports [104.40202007324633]
スポーツビデオQAタスク用に特別に設計された最初のデータセットであるSports-QAを紹介する。
Sports-QAデータセットには、説明、時系列、因果関係、反事実条件など、さまざまな種類の質問が含まれている。
質問応答のための時間的情報の特定の尺度に自動的にフォーカスできる新しいオートフォーカス変換器(AFT)を提案する。
論文 参考訳(メタデータ) (2024-01-03T02:22:34Z) - A Survey on Video Action Recognition in Sports: Datasets, Methods and
Applications [60.3327085463545]
本稿では,スポーツ分析のための映像行動認識に関する調査を行う。
サッカー、バスケットボール、バレーボール、ホッケー、フィギュアスケート、体操、卓球、ダイビング、バドミントンなど10種以上のスポーツを紹介します。
本研究では,サッカー,バスケットボール,卓球,フィギュアスケート動作認識をサポートするPaddlePaddleを用いたツールボックスを開発した。
論文 参考訳(メタデータ) (2022-06-02T13:19:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。