論文の概要: IRIS: Interpretable Rubric-Informed Segmentation for Action Quality
Assessment
- arxiv url: http://arxiv.org/abs/2303.09097v1
- Date: Thu, 16 Mar 2023 06:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:35:19.409412
- Title: IRIS: Interpretable Rubric-Informed Segmentation for Action Quality
Assessment
- Title(参考訳): iris:rubric-informed segmentationによる動作品質評価
- Authors: Hitoshi Matsuyama, Nobuo Kawaguchi, Brian Y. Lim
- Abstract要約: スポーツビデオのアクションクオリティアセスメント(AQA)は、オリンピックの審査員を模倣して、2つ目の意見として、あるいはトレーニングのためにパフォーマンスを評価するのに役立つ。
これらのAIメソッドは解釈不能であり、アルゴリズムのアカウンタビリティにとって重要なスコアを正当化しない。
Informed on action sequences for AQA。
- 参考スコア(独自算出の注目度): 7.929322038634728
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI-driven Action Quality Assessment (AQA) of sports videos can mimic Olympic
judges to help score performances as a second opinion or for training. However,
these AI methods are uninterpretable and do not justify their scores, which is
important for algorithmic accountability. Indeed, to account for their
decisions, instead of scoring subjectively, sports judges use a consistent set
of criteria - rubric - on multiple actions in each performance sequence.
Therefore, we propose IRIS to perform Interpretable Rubric-Informed
Segmentation on action sequences for AQA. We investigated IRIS for scoring
videos of figure skating performance. IRIS predicts (1) action segments, (2)
technical element score differences of each segment relative to base scores,
(3) multiple program component scores, and (4) the summed final score. In a
modeling study, we found that IRIS performs better than non-interpretable,
state-of-the-art models. In a formative user study, practicing figure skaters
agreed with the rubric-informed explanations, found them useful, and trusted AI
judgments more. This work highlights the importance of using judgment rubrics
to account for AI decisions.
- Abstract(参考訳): スポーツビデオのai駆動行動品質評価(aqa)は、オリンピックの審査員を模倣して、パフォーマンスを第二の意見やトレーニングとしてスコアリングする。
しかし、これらのAIメソッドは解釈不能であり、アルゴリズムのアカウンタビリティにとって重要なスコアを正当化しない。
実際、主観的な判断を下す代わりに、スポーツの審査員は、各パフォーマンスシーケンスにおける複数のアクションに対して一貫した基準(ルーリック)を使用する。
そこで本研究では,AQAの動作シーケンスに対して,解釈可能なルーブリックインフォームドセグメンテーションを行うためのIRISを提案する。
IRISを用いてフィギュアスケートのパフォーマンスのスコアリングを行った。
IRISは(1)アクションセグメント,(2)ベーススコアに対する各セグメントの技術的要素スコア差,(3)複数のプログラムコンポーネントスコア,(4)総和ファイナルスコアを予測する。
モデルスタディにおいて、IRISは非解釈可能な最先端モデルよりも優れた性能を示した。
フォーマティブなユーザスタディでは、フィギュアスケートの練習がルーリックインフォームドの説明に同意し、それらが有用であることが分かり、信頼できるAI判断がより多くなった。
この研究は、AI決定を考慮に入れた判断ルーリックを使うことの重要性を強調している。
関連論文リスト
- SS-VAERR: Self-Supervised Apparent Emotional Reaction Recognition from
Video [61.21388780334379]
この研究は、自己監督的な方法で行われるビデオのみの入力からの明らかな感情的反応の認識に焦点を当てる。
ネットワークは、まず異なる自己教師付きプレテキストタスクで事前訓練され、その後、下流のターゲットタスクで微調整される。
論文 参考訳(メタデータ) (2022-10-20T15:21:51Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Do We Need Another Explainable AI Method? Toward Unifying Post-hoc XAI
Evaluation Methods into an Interactive and Multi-dimensional Benchmark [6.511859672210113]
我々は,xAIアルゴリズムに適用された排他的機能テスト手法を統一するベンチマークであるComparce-xAIを提案する。
このベンチマークは、xAIメソッドを評価する複雑さを3つの階層的なスコアリングにカプセル化する。
インタラクティブなユーザインターフェースは、xAI結果の解釈におけるエラーの軽減に役立つ。
論文 参考訳(メタデータ) (2022-06-08T06:13:39Z) - Group-aware Contrastive Regression for Action Quality Assessment [85.43203180953076]
ビデオ間の関係は、より正確な行動品質評価のための重要な手がかりとなることを示す。
提案手法は従来の手法よりも大きなマージンを達成し,3つのベンチマークで新たな最先端の手法を確立する。
論文 参考訳(メタデータ) (2021-08-17T17:59:39Z) - Hybrid Dynamic-static Context-aware Attention Network for Action
Assessment in Long Videos [96.45804577283563]
本稿では,長期ビデオにおけるアクションアセスメントのための新しいハイブリットDynAmic-static Context-aware AttenTION NETwork(ACTION-NET)を提案する。
ビデオのダイナミックな情報を学習すると同時に,特定フレームにおける検出した選手の静的姿勢にも焦点をあてる。
2つのストリームの特徴を組み合わせることで、専門家が与えた地道的なスコアによって監督され、最終的なビデオスコアを後退させます。
論文 参考訳(メタデータ) (2020-08-13T15:51:42Z) - Evaluation Toolkit For Robustness Testing Of Automatic Essay Scoring
Systems [64.4896118325552]
モデル逆算評価スキームと関連するメトリクスを用いて、現状のAESモデルを評価する。
AESモデルは非常に過大評価されていることがわかった。質問の話題に関係のない内容の重い修正(25%まで)でさえ、モデルが生み出すスコアを低下させることはない。
論文 参考訳(メタデータ) (2020-07-14T03:49:43Z) - Towards Game-Playing AI Benchmarks via Performance Reporting Standards [0.9137554315375919]
本稿では,AIゲームプレイパフォーマンスの報告ガイドラインを提案し,従えば,異なるAIアプローチの非バイアス比較に適した情報を提供する。
私たちが説明するビジョンは、さまざまなAIアルゴリズムの振る舞いに関するより一般的な結論を引き出すために、このようなガイドラインに基づいたベンチマークとコンペを構築することです。
論文 参考訳(メタデータ) (2020-07-06T13:27:00Z) - Uncertainty-aware Score Distribution Learning for Action Quality
Assessment [91.05846506274881]
行動品質評価(AQA)のための不確実性認識スコア分布学習(USDL)手法を提案する。
具体的には、異なる評価スコアの確率を記述したスコア分布に関連する事例として、アクションを考察する。
微粒なスコアラベルが利用できる状況下では、多パス不確実性を考慮したスコア分布学習法(MUSDL)を考案し、スコアの不整合成分を探索する。
論文 参考訳(メタデータ) (2020-06-13T15:41:29Z) - Action Quality Assessment using Siamese Network-Based Deep Metric
Learning [7.945673227394573]
提案されたスコアリングモデルはオリンピックのダイビングと体育のヴォートでテストされている。
このモデルは、既存の最先端のスコアリングモデルよりも優れています。
論文 参考訳(メタデータ) (2020-02-27T14:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。