論文の概要: Boosting Gesture Recognition with an Automatic Gesture Annotation Framework
- arxiv url: http://arxiv.org/abs/2401.11150v2
- Date: Sat, 05 Oct 2024 06:08:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-08 13:38:11.029847
- Title: Boosting Gesture Recognition with an Automatic Gesture Annotation Framework
- Title(参考訳): 自動ジェスチャーアノテーションフレームワークによるジェスチャー認識の高速化
- Authors: Junxiao Shen, Xuhai Xu, Ran Tan, Amy Karlson, Evan Strasnick,
- Abstract要約: そこで本稿では,ジェスチャクラスを自動的にアノテートし,その時間範囲を識別するフレームワークを提案する。
本フレームワークは,(1)コネクショニスト時間分類(CTC)の損失を利用した新しいアノテーションモデル,(2)半教師付き学習パイプラインからなる。
これらの高品質な擬似ラベルは、他の下流ジェスチャ認識モデルの精度を高めるためにも使用できる。
- 参考スコア(独自算出の注目度): 10.158684480548242
- License:
- Abstract: Training a real-time gesture recognition model heavily relies on annotated data. However, manual data annotation is costly and demands substantial human effort. In order to address this challenge, we propose a framework that can automatically annotate gesture classes and identify their temporal ranges. Our framework consists of two key components: (1) a novel annotation model that leverages the Connectionist Temporal Classification (CTC) loss, and (2) a semi-supervised learning pipeline that enables the model to improve its performance by training on its own predictions, known as pseudo labels. These high-quality pseudo labels can also be used to enhance the accuracy of other downstream gesture recognition models. To evaluate our framework, we conducted experiments using two publicly available gesture datasets. Our ablation study demonstrates that our annotation model design surpasses the baseline in terms of both gesture classification accuracy (3-4% improvement) and localization accuracy (71-75% improvement). Additionally, we illustrate that the pseudo-labeled dataset produced from the proposed framework significantly boosts the accuracy of a pre-trained downstream gesture recognition model by 11-18%. We believe that this annotation framework has immense potential to improve the training of downstream gesture recognition models using unlabeled datasets.
- Abstract(参考訳): リアルタイムジェスチャー認識モデルのトレーニングは、注釈付きデータに大きく依存する。
しかし、手動のデータアノテーションは高価であり、かなりの人的努力を必要とする。
この課題に対処するために,ジェスチャクラスを自動的に注釈付けし,時間範囲を識別するフレームワークを提案する。
本フレームワークは,(1)コネクショニスト時間分類(CTC)の損失を利用した新しいアノテーションモデル,(2)擬似ラベルと呼ばれる独自の予測に基づいて,モデルの性能向上を可能にする半教師付き学習パイプライン,の2つの要素から構成される。
これらの高品質な擬似ラベルは、他の下流ジェスチャ認識モデルの精度を高めるためにも使用できる。
フレームワークを評価するために、2つの公開ジェスチャーデータセットを用いて実験を行った。
本研究は,ジェスチャ分類精度(3-4%改善)とローカライゼーション精度(71-75%改善)の両面で,アノテーションモデル設計がベースラインを超えることを示す。
さらに,提案フレームワークから作成した擬似ラベル付きデータセットは,事前学習した下流ジェスチャ認識モデルの精度を11-18%向上させることを示した。
このアノテーションフレームワークは、ラベルなしデータセットを用いた下流ジェスチャ認識モデルのトレーニングを改善する大きな可能性を秘めていると信じている。
関連論文リスト
- Selective Annotation via Data Allocation: These Data Should Be Triaged to Experts for Annotation Rather Than the Model [42.70608373297776]
我々は、SANTと呼ばれる選択的なアノテーションフレームワークを提案する。
提案した誤り認識トリアージと二重み付け機構により、トリアージ・ツー・ヒューマンデータとトリアージ・ツー・モデルデータの両方を効果的に活用する。
実験の結果、SANTは他のベースラインを一貫して上回り、専門家とモデルワーカーの両方にデータの適切な割り当てを通じて高品質なアノテーションをもたらすことが示された。
論文 参考訳(メタデータ) (2024-05-20T14:52:05Z) - Guiding Attention in End-to-End Driving Models [49.762868784033785]
模倣学習によって訓練された視覚ベースのエンドツーエンドの運転モデルは、自動運転のための安価なソリューションにつながる可能性がある。
トレーニング中に損失項を追加することにより、これらのモデルの注意を誘導し、運転品質を向上させる方法について検討する。
従来の研究とは対照的に,本手法では,テスト期間中にこれらの有意義なセマンティックマップを利用できない。
論文 参考訳(メタデータ) (2024-04-30T23:18:51Z) - Self-Supervised Representation Learning for Online Handwriting Text
Classification [0.8594140167290099]
本稿では,日本語と中国語の個人によるオンライン筆跡から情報表現を抽出するための事前学習の前提として,新しいストロークマスキング(POSM)を提案する。
抽出した表現の質を評価するために,本質的評価法と外生的評価法の両方を用いる。
事前訓練されたモデルは、作家の識別、性別分類、手書きの分類といったタスクにおいて、最先端の結果を達成するために微調整される。
論文 参考訳(メタデータ) (2023-10-10T14:07:49Z) - How Good is the Model in Model-in-the-loop Event Coreference Resolution
Annotation? [3.712417884848568]
本稿では、イベントコア参照解決のためのモデル-in-the-loopアノテーションアプローチを提案する。
まずアノテーションプロセスのシミュレートを行い,新しいアノテータ中心のリコール・ワーク・トレードオフ・メトリックを用いて,基礎となるモデルとデータセットの結果を比較することにより,このアプローチの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-06T18:06:24Z) - Self-Training of Handwritten Word Recognition for Synthetic-to-Real
Adaptation [4.111899441919165]
そこで本研究では,手書きテキスト認識モデルを学習するための自己学習手法を提案する。
提案手法は、合成データに基づいて訓練された初期モデルを用いて、ラベルなしターゲットデータセットの予測を行う。
提案手法は,広範に使用されている4つのベンチマークデータセットに対して評価し,完全に教師された方法で訓練されたモデルとのギャップを埋めることの有効性を示す。
論文 参考訳(メタデータ) (2022-06-07T09:43:25Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Dynamic Supervisor for Cross-dataset Object Detection [52.95818230087297]
オブジェクト検出タスクにおけるデータセット間のトレーニングは、データセットにまたがるカテゴリ内の不整合が、完全に教師付き学習を半教師付き学習に変換するため、複雑である。
本稿では,ハードラベルとソフトラベルを併用した複数更新サブモデルを用いて,アノテーションを複数回更新する動的スーパーバイザフレームワークを提案する。
最終生成アノテーションでは、ハードラベルトレーニングとソフトラベルトレーニングを統合することで、リコールと精度が大幅に向上した。
論文 参考訳(メタデータ) (2022-04-01T03:18:46Z) - Distilling Interpretable Models into Human-Readable Code [71.11328360614479]
人間可読性は機械学習モデル解釈可能性にとって重要で望ましい標準である。
従来の方法を用いて解釈可能なモデルを訓練し,それを簡潔で可読なコードに抽出する。
本稿では,幅広いユースケースで効率的に,確実に高品質な結果を生成する分別線形曲線フィッティングアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-01-21T01:46:36Z) - Data Cleansing with Contrastive Learning for Vocal Note Event
Annotations [1.859931123372708]
本稿では,時間変化のある構造化ラベルのための新しいデータクリーニングモデルを提案する。
本モデルでは, ラベルの局所的な変形を自動的に生成することにより, 対照的な学習方法を訓練する。
提案手法を用いて学習すると,転写モデルの精度が大幅に向上することが実証された。
論文 参考訳(メタデータ) (2020-08-05T12:24:37Z) - Improving Semantic Segmentation via Self-Training [75.07114899941095]
半教師付きアプローチ,特に自己学習パラダイムを用いて,最先端の成果を得ることができることを示す。
まず、ラベル付きデータに基づいて教師モデルを訓練し、次にラベルなしデータの大規模なセット上で擬似ラベルを生成する。
私たちの堅牢なトレーニングフレームワークは、人名と擬似ラベルを共同で消化し、Cityscapes、CamVid、KITTIデータセット上で最高のパフォーマンスを達成することができます。
論文 参考訳(メタデータ) (2020-04-30T17:09:17Z) - Temporal Embeddings and Transformer Models for Narrative Text
Understanding [72.88083067388155]
キャラクタ関係モデリングのための物語テキスト理解のための2つのアプローチを提案する。
これらの関係の時間的進化は動的単語埋め込みによって説明され、時間とともに意味的変化を学ぶように設計されている。
最新の変換器モデルBERTに基づく教師付き学習手法を用いて文字間の静的な関係を検出する。
論文 参考訳(メタデータ) (2020-03-19T14:23:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。