論文の概要: Exploring Sub-skeleton Trajectories for Interpretable Recognition of
Sign Language
- arxiv url: http://arxiv.org/abs/2202.01390v1
- Date: Thu, 3 Feb 2022 03:32:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-04 14:28:17.358835
- Title: Exploring Sub-skeleton Trajectories for Interpretable Recognition of
Sign Language
- Title(参考訳): 手話認識のためのサブスケルトン軌道探索
- Authors: Joachim Gudmundsson, Martin P. Seybold, John Pfeifer
- Abstract要約: 我々は手話語を正確に認識する問題について研究する。
本手法は, サブスケルトンの運動面と呼ばれる幾何学的特徴空間を探索する。
驚いたことに、我々の単純な手法は、最近の最先端のアプローチよりも手話認識を改善する。
- 参考スコア(独自算出の注目度): 2.1178416840822027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in tracking sensors and pose estimation software enable smart
systems to use trajectories of skeleton joint locations for supervised
learning. We study the problem of accurately recognizing sign language words,
which is key to narrowing the communication gap between hard and non-hard of
hearing people.
Our method explores a geometric feature space that we call `sub-skeleton'
aspects of movement. We assess similarity of feature space trajectories using
natural, speed invariant distance measures, which enables clear and insightful
nearest neighbor classification. The simplicity and scalability of our basic
method allows for immediate application in different data domains with little
to no parameter tuning.
We demonstrate the effectiveness of our basic method, and a boosted
variation, with experiments on data from different application domains and
tracking technologies. Surprisingly, our simple methods improve sign
recognition over recent, state-of-the-art approaches.
- Abstract(参考訳): 近年のトラッキングセンサとポーズ推定ソフトウェアの進歩により、スマートシステムは骨格関節位置の軌跡を教師付き学習に利用できるようになった。
難聴者と非難聴者とのコミュニケーションギャップを狭める鍵となる手話単語を正確に認識する問題について検討する。
本手法は,移動の「サブスケルトン」という幾何学的特徴空間を探索する。
特徴空間軌跡の類似性を自然, 速度不変距離尺度を用いて評価し, 明瞭かつ洞察に富む近傍分類を可能にした。
基本的手法の単純さとスケーラビリティにより、パラメータチューニングをほとんど行わずに、異なるデータドメインで即時に適用できます。
そこで本研究では,アプリケーションドメインの異なるデータと追跡技術を用いて,基本手法の有効性と変化の増大を実証する。
驚くべきことに、私たちのシンプルな方法は、最近の最先端のアプローチよりもサイン認識を改善します。
関連論文リスト
- Language-driven Grasp Detection with Mask-guided Attention [10.231956034184265]
マスク誘導型注目を用いた言語駆動型グリップ検出手法を提案する。
提案手法では,視覚データ,セグメンテーションマスク機能,自然言語命令を統合した。
我々の研究は、言語駆動型把握検出のための新しいフレームワークを導入し、言語駆動型ロボットアプリケーションへの道を開いた。
論文 参考訳(メタデータ) (2024-07-29T10:55:17Z) - Self-Supervised Representation Learning with Spatial-Temporal Consistency for Sign Language Recognition [96.62264528407863]
本研究では,空間的時間的整合性を通じてリッチな文脈を探索する自己教師付きコントラスト学習フレームワークを提案する。
動きと関節のモーダル性の相補性に着想を得て,手話モデルに一階動作情報を導入する。
提案手法は,4つの公開ベンチマークの広範な実験により評価され,新しい最先端性能と顕著なマージンを実現している。
論文 参考訳(メタデータ) (2024-06-15T04:50:19Z) - Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.68088298632865]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - Cognitive Semantic Communication Systems Driven by Knowledge Graph:
Principle, Implementation, and Performance Evaluation [74.38561925376996]
単一ユーザと複数ユーザのコミュニケーションシナリオに対して,認知意味コミュニケーションフレームワークが2つ提案されている。
知識グラフから推論規則をマイニングすることにより,効果的な意味補正アルゴリズムを提案する。
マルチユーザ認知型セマンティックコミュニケーションシステムにおいて,異なるユーザのメッセージを識別するために,メッセージ復元アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-15T12:01:43Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - TASKED: Transformer-based Adversarial learning for human activity
recognition using wearable sensors via Self-KnowledgE Distillation [6.458496335718508]
本稿では,TASKED(Self-KnowledgE Distillation)を用いたウェアラブルセンサを用いた,トランスフォーマーに基づく人間行動認識のための新しい逆学習フレームワークを提案する。
提案手法では,教師なしの自己知識蒸留を採用し,訓練手順の安定性と人間の活動認識性能を向上させる。
論文 参考訳(メタデータ) (2022-09-14T11:08:48Z) - Metric-based multimodal meta-learning for human movement identification
via footstep recognition [3.300376360949452]
マルチモーダル・フレームワークを導入した新しいメトリック・ベース・ラーニング・アプローチについて述べる。
我々は,全方位センサシステムから得られた低感度データから汎用表現を学習する。
本研究は,マルチセンサデータに対するメトリクスに基づくコントラスト学習手法を用いて,データ不足の影響を緩和する。
論文 参考訳(メタデータ) (2021-11-15T18:46:14Z) - Geography-Aware Self-Supervised Learning [79.4009241781968]
異なる特徴により、標準ベンチマークにおけるコントラスト学習と教師あり学習の間には、非自明なギャップが持続していることが示される。
本稿では,リモートセンシングデータの空間的整合性を利用した新しいトレーニング手法を提案する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションにおけるコントラスト学習と教師あり学習のギャップを埋めるものである。
論文 参考訳(メタデータ) (2020-11-19T17:29:13Z) - Learning Invariant Representations for Reinforcement Learning without
Reconstruction [98.33235415273562]
本研究では,表現学習が画像などのリッチな観察からの強化学習を,ドメイン知識や画素再構成に頼ることなく促進する方法について検討する。
シミュレーションメトリクスは、連続MDPの状態間の振る舞いの類似性を定量化する。
修正された視覚的 MuJoCo タスクを用いてタスク関連情報を無視する手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-06-18T17:59:35Z) - SL-DML: Signal Level Deep Metric Learning for Multimodal One-Shot Action
Recognition [0.0]
埋め込み空間における近接探索に対する行動認識問題を削減するための計量学習手法を提案する。
我々は信号を画像にエンコードし、深い残差CNNを用いて特徴を抽出する。
結果として得られるエンコーダは特徴を埋め込み空間に変換し、より近い距離は類似の動作を符号化し、高い距離は異なる動作を符号化する。
論文 参考訳(メタデータ) (2020-04-23T11:28:27Z) - Trajectory annotation using sequences of spatial perception [0.0]
近い将来、より多くのマシンが人間の空間の近くでタスクを実行するようになる。
この作業は、この課題に対処するための基盤を構築します。
本稿では,ニューラルオートエンコーディングに基づく教師なし学習手法を提案する。
論文 参考訳(メタデータ) (2020-04-11T12:22:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。