Fugu-MT 論文翻訳(概要): IRIS: Interpretable Rubric-Informed Segmentation for Action Quality Assessment

論文の概要: IRIS: Interpretable Rubric-Informed Segmentation for Action Quality Assessment

arxiv url: http://arxiv.org/abs/2303.09097v1
Date: Thu, 16 Mar 2023 06:01:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-17 16:35:19.409412
Title: IRIS: Interpretable Rubric-Informed Segmentation for Action Quality Assessment
Title（参考訳）: iris:rubric-informed segmentationによる動作品質評価
Authors: Hitoshi Matsuyama, Nobuo Kawaguchi, Brian Y. Lim
Abstract要約: スポーツビデオのアクションクオリティアセスメント(AQA)は、オリンピックの審査員を模倣して、2つ目の意見として、あるいはトレーニングのためにパフォーマンスを評価するのに役立つ。これらのAIメソッドは解釈不能であり、アルゴリズムのアカウンタビリティにとって重要なスコアを正当化しない。 Informed on action sequences for AQA。
参考スコア（独自算出の注目度）: 7.929322038634728
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: AI-driven Action Quality Assessment (AQA) of sports videos can mimic Olympic judges to help score performances as a second opinion or for training. However, these AI methods are uninterpretable and do not justify their scores, which is important for algorithmic accountability. Indeed, to account for their decisions, instead of scoring subjectively, sports judges use a consistent set of criteria - rubric - on multiple actions in each performance sequence. Therefore, we propose IRIS to perform Interpretable Rubric-Informed Segmentation on action sequences for AQA. We investigated IRIS for scoring videos of figure skating performance. IRIS predicts (1) action segments, (2) technical element score differences of each segment relative to base scores, (3) multiple program component scores, and (4) the summed final score. In a modeling study, we found that IRIS performs better than non-interpretable, state-of-the-art models. In a formative user study, practicing figure skaters agreed with the rubric-informed explanations, found them useful, and trusted AI judgments more. This work highlights the importance of using judgment rubrics to account for AI decisions.
Abstract（参考訳）: スポーツビデオのai駆動行動品質評価(aqa)は、オリンピックの審査員を模倣して、パフォーマンスを第二の意見やトレーニングとしてスコアリングする。しかし、これらのAIメソッドは解釈不能であり、アルゴリズムのアカウンタビリティにとって重要なスコアを正当化しない。実際、主観的な判断を下す代わりに、スポーツの審査員は、各パフォーマンスシーケンスにおける複数のアクションに対して一貫した基準(ルーリック)を使用する。そこで本研究では,AQAの動作シーケンスに対して,解釈可能なルーブリックインフォームドセグメンテーションを行うためのIRISを提案する。 IRISを用いてフィギュアスケートのパフォーマンスのスコアリングを行った。 IRISは(1)アクションセグメント,(2)ベーススコアに対する各セグメントの技術的要素スコア差,(3)複数のプログラムコンポーネントスコア,(4)総和ファイナルスコアを予測する。モデルスタディにおいて、IRISは非解釈可能な最先端モデルよりも優れた性能を示した。フォーマティブなユーザスタディでは、フィギュアスケートの練習がルーリックインフォームドの説明に同意し、それらが有用であることが分かり、信頼できるAI判断がより多くなった。この研究は、AI決定を考慮に入れた判断ルーリックを使うことの重要性を強調している。

関連論文リスト

ProSkill: Segment-Level Skill Assessment in Procedural Videos [25.82207413553515]
ProSkillは、手続きタスクにおけるアクションレベルのスキルアセスメントのための最初のベンチマークデータセットである。私たちはデータセットを使用して、最先端のスキルアセスメントアルゴリズムをベンチマークします。
論文参考訳（メタデータ） (2026-01-28T14:44:09Z)
FineSkiing: A Fine-grained Benchmark for Skiing Action Quality Assessment [18.701250140835224]
アクション品質アセスメント(AQA)は、スポーツ活動の評価と評価を目的としている。既存のAQA手法は、主にビデオ全体から抽出された特徴に基づいてスコアを予測する。本稿では,空飛ぶスキーのための微粒なサブスコアと推論アノテーションを含む最初のAQAデータセットを構築する。
論文参考訳（メタデータ） (2025-11-13T12:29:39Z)
CATArena: Evaluation of LLM Agents through Iterative Tournament Competitions [49.02422075498554]
大言語モデル(LLM)エージェントは、基本的なテキスト生成から、外部ツールとのインタラクションを通じて、複雑なタスクを自律的に完了するまで進化してきた。本研究では,人間レベルインテリジェンスに向けたエージェント進化のコアドライバとして,自己改善とピアラーニングの両方を含む学習能力の重要性を強調した。本稿では,反復的かつ競合的なピアラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2025-10-30T15:22:53Z)
Teach-to-Reason with Scoring: Self-Explainable Rationale-Driven Multi-Trait Essay Scoring [5.632624116225276]
マルチトレイ自動化エッセイスコアシステム(AES)は、エッセイの多様な側面のきめ細かい評価を提供する。以前のシステムは、なぜ特定の特性スコアが割り当てられたのかを説明できない。本稿では,自己説明可能なRationale-Driven Multi-Trit自動評価フレームワークを提案する。
論文参考訳（メタデータ） (2025-02-28T05:54:23Z)
Validity Arguments For Constructed Response Scoring Using Generative Artificial Intelligence Applications [0.0]
ジェネレーティブAIは、従来のAIスコアリングにおける手作り機能に必要な労力を減らすため、特に魅力的である。我々は,人間の評価,特徴に基づく自然言語処理AIスコアリングエンジン,生成AIを用いたスコアリングシステムに必要な妥当性証拠を比較した。
論文参考訳（メタデータ） (2025-01-04T16:59:29Z)
CLAIR-A: Leveraging Large Language Models to Judge Audio Captions [73.51087998971418]
機械生成オーディオキャプションの評価は、様々な要因を検討する必要がある複雑なタスクである。本稿では,大規模言語モデルのゼロショット機能を活用するシンプルで柔軟なCLAIR-Aを提案する。我々の評価では、CLAIR-Aは従来のメトリクスと比較して品質の人的判断を良く予測する。
論文参考訳（メタデータ） (2024-09-19T17:59:52Z)
Classification Matters: Improving Video Action Detection with Class-Specific Attention [61.14469113965433]
ビデオアクション検出(VAD)は、アクターを検出し、そのアクションをビデオで分類することを目的としている。一般的な手法が、分類のための特徴をどう形成するかを分析し、アクター領域の優先順位付けを行う。本稿では,アクターに対する偏見を減らし,各アクションクラスに関連する文脈に注意を払うことを提案する。
論文参考訳（メタデータ） (2024-07-29T04:43:58Z)
GAIA: Rethinking Action Quality Assessment for AI-Generated Videos [56.047773400426486]
アクション品質アセスメント(AQA)アルゴリズムは、主に実際の特定のシナリオからのアクションに焦点を当て、規範的なアクション機能で事前訓練されている。我々は,新たな因果推論の観点から大規模主観評価を行うことにより,GAIAを構築した。その結果、従来のAQA手法、最近のT2Vベンチマークにおけるアクション関連指標、メインストリームビデオ品質手法は、それぞれ0.454、0.191、0.519のSRCCで性能が良くないことがわかった。
論文参考訳（メタデータ） (2024-06-10T08:18:07Z)
CompA: Addressing the Gap in Compositional Reasoning in Audio-Language Models [41.98394436858637]
提案するCompAは,実世界の音声サンプルの大部分を収録した,専門家による2つのベンチマークのコレクションである。まず,現在のALMはランダムな確率よりもわずかに優れた性能を示し,構成的推論に苦しむことを示す。次に,新しい学習法を用いてCLAPを微調整し,合成推論能力を向上させるCompA-CLAPを提案する。
論文参考訳（メタデータ） (2023-10-12T22:43:38Z)
SS-VAERR: Self-Supervised Apparent Emotional Reaction Recognition from Video [61.21388780334379]
この研究は、自己監督的な方法で行われるビデオのみの入力からの明らかな感情的反応の認識に焦点を当てる。ネットワークは、まず異なる自己教師付きプレテキストタスクで事前訓練され、その後、下流のターゲットタスクで微調整される。
論文参考訳（メタデータ） (2022-10-20T15:21:51Z)
Group-aware Contrastive Regression for Action Quality Assessment [85.43203180953076]
ビデオ間の関係は、より正確な行動品質評価のための重要な手がかりとなることを示す。提案手法は従来の手法よりも大きなマージンを達成し,3つのベンチマークで新たな最先端の手法を確立する。
論文参考訳（メタデータ） (2021-08-17T17:59:39Z)
Towards Game-Playing AI Benchmarks via Performance Reporting Standards [0.9137554315375919]
本稿では,AIゲームプレイパフォーマンスの報告ガイドラインを提案し,従えば,異なるAIアプローチの非バイアス比較に適した情報を提供する。私たちが説明するビジョンは、さまざまなAIアルゴリズムの振る舞いに関するより一般的な結論を引き出すために、このようなガイドラインに基づいたベンチマークとコンペを構築することです。
論文参考訳（メタデータ） (2020-07-06T13:27:00Z)
Uncertainty-aware Score Distribution Learning for Action Quality Assessment [91.05846506274881]
行動品質評価(AQA)のための不確実性認識スコア分布学習(USDL)手法を提案する。具体的には、異なる評価スコアの確率を記述したスコア分布に関連する事例として、アクションを考察する。微粒なスコアラベルが利用できる状況下では、多パス不確実性を考慮したスコア分布学習法(MUSDL)を考案し、スコアの不整合成分を探索する。
論文参考訳（メタデータ） (2020-06-13T15:41:29Z)
Action Quality Assessment using Siamese Network-Based Deep Metric Learning [7.945673227394573]
提案されたスコアリングモデルはオリンピックのダイビングと体育のヴォートでテストされている。このモデルは、既存の最先端のスコアリングモデルよりも優れています。
論文参考訳（メタデータ） (2020-02-27T14:00:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。