論文の概要: Auto-Encoding Score Distribution Regression for Action Quality
Assessment
- arxiv url: http://arxiv.org/abs/2111.11029v1
- Date: Mon, 22 Nov 2021 07:30:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 23:50:57.173659
- Title: Auto-Encoding Score Distribution Regression for Action Quality
Assessment
- Title(参考訳): 行動品質評価のための自動エンコードスコア分布回帰
- Authors: Boyu Zhang, Jiayuan Chen, Yinfei Xu, Hui Zhang, Xu Yang and Xin Geng
- Abstract要約: ビデオからのアクション品質評価(AQA)は難しい視力課題である。
伝統的に、AQAタスクは、ビデオとアクションスコアの間の基盤となるマッピングを学ぶための回帰問題として扱われる。
上記の問題に対処するため、配電用オートエンコーダ(DAE)を開発した。
- 参考スコア(独自算出の注目度): 41.45638722765149
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Action quality assessment (AQA) from videos is a challenging vision task
since the relation between videos and action scores is difficult to model.
Thus, action quality assessment has been widely studied in the literature.
Traditionally, AQA task is treated as a regression problem to learn the
underlying mappings between videos and action scores. More recently, the method
of uncertainty score distribution learning (USDL) made success due to the
introduction of label distribution learning (LDL). But USDL does not apply to
dataset with continuous labels and needs a fixed variance in training. In this
paper, to address the above problems, we further develop Distribution
Auto-Encoder (DAE). DAE takes both advantages of regression algorithms and
label distribution learning (LDL).Specifically, it encodes videos into
distributions and uses the reparameterization trick in variational
auto-encoders (VAE) to sample scores, which establishes a more accurate mapping
between videos and scores. Meanwhile, a combined loss is constructed to
accelerate the training of DAE. DAE-MT is further proposed to deal with AQA on
multi-task datasets. We evaluate our DAE approach on MTL-AQA and JIGSAWS
datasets. Experimental results on public datasets demonstrate that our method
achieves state-of-the-arts under the Spearman's Rank Correlation: 0.9449 on
MTL-AQA and 0.73 on JIGSAWS.
- Abstract(参考訳): ビデオからのアクション品質評価(AQA)は、ビデオとアクションスコアの関係をモデル化することが困難であるため、難しい視力課題である。
このように、行動品質評価は文献で広く研究されている。
伝統的に、AQAタスクは、ビデオとアクションスコアの間の基盤となるマッピングを学ぶための回帰問題として扱われる。
近年,ラベル分布学習(LDL)の導入により,不確実性スコア分布学習(USDL)が成功している。
しかし、USDLは連続ラベル付きデータセットには適用せず、トレーニングに一定の分散が必要である。
本稿では,上記の問題に対処するため,分散オートエンコーダ(dae)をさらに開発する。
DAEは回帰アルゴリズムとラベル分布学習(LDL)の両方の利点がある。
具体的には、動画を配信にエンコードし、変分自動エンコーダ(VAE)で再パラメータ化トリックを使用してスコアをサンプリングし、ビデオとスコアのより正確なマッピングを確立する。
一方、DAEの訓練を加速するために複合的な損失を構築する。
DAE-MTはマルチタスクデータセットのAQAを扱うためにさらに提案されている。
MTL-AQAおよびJIGSAWSデータセットに対するDAEアプローチの評価を行った。
公開データセットを用いた実験結果から,本手法がSpearman's Rank correlation(MTL-AQA)の0.9449,JIGSAWS(JIGSAWS)の0.73の最先端技術を実現することが示された。
関連論文リスト
- Dataset Condensation with Latent Quantile Matching [5.466962214217334]
電流分布マッチング (DM) に基づく直流法は, 合成外乱と実外乱の遅延埋め込みの平均をマッチングすることにより, 合成データセットを学習する。
本稿では,2つの分布間の適合試験統計量の良さを最小化するために,遅延埋め込みの量子化と一致する潜在量子マッチング(LQM)を提案する。
論文 参考訳(メタデータ) (2024-06-14T09:20:44Z) - Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Stable Target Field for Reduced Variance Score Estimation in Diffusion
Models [5.9115407007859755]
拡散モデルは、固定された前方拡散過程を反転させてサンプルを生成する。
このような分散の源泉は、中間雑音分散スケールの取り扱いにあると論じる。
より安定したトレーニングターゲットとして重み付けされた条件スコアを計算するために使用する参照バッチを組み込むことにより、この問題を修復することを提案する。
論文 参考訳(メタデータ) (2023-02-01T18:57:01Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Group-aware Contrastive Regression for Action Quality Assessment [85.43203180953076]
ビデオ間の関係は、より正確な行動品質評価のための重要な手がかりとなることを示す。
提案手法は従来の手法よりも大きなマージンを達成し,3つのベンチマークで新たな最先端の手法を確立する。
論文 参考訳(メタデータ) (2021-08-17T17:59:39Z) - Learning to Perturb Word Embeddings for Out-of-distribution QA [55.103586220757464]
本論文では,入力問題と文脈の単語埋め込みを意味論を変化させることなく学習するノイズ発生器に基づく簡便かつ効果的なDA法を提案する。
ひとつのソースデータセットに,5つの異なるターゲットドメインに埋め込むことで,トレーニングされたQAモデルのパフォーマンスを検証する。
特に、私たちのトレーニングを受けたモデルは、240K以上の人工的なQAペアでトレーニングされたモデルよりも優れています。
論文 参考訳(メタデータ) (2021-05-06T14:12:26Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Zero-Resource Multi-Dialectal Arabic Natural Language Understanding [0.0]
本稿では,現代標準アラビア語(MSA)データのみに基づく事前学習言語モデルを微調整する場合に,Dialectal Arabic(DA)のゼロショット性能について検討する。
ラベルなしDAデータによる自己学習を提案し、名前付きエンティティ認識(NER)、POSタグ付け(POS)、SRD(Sarcasm Detection)のコンテキストに適用する。
その結果,未ラベルDAデータを用いた自己学習の有効性が示された。
論文 参考訳(メタデータ) (2021-04-14T02:29:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。