論文の概要: Automatic Hand Sign Recognition: Identify Unusuality through Latent
Cognizance
- arxiv url: http://arxiv.org/abs/2110.15542v1
- Date: Fri, 29 Oct 2021 05:15:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 13:38:21.910282
- Title: Automatic Hand Sign Recognition: Identify Unusuality through Latent
Cognizance
- Title(参考訳): 手指の自動認識:潜在認識による異常の識別
- Authors: Pisit Nakjai and Tatpong Katanyukul
- Abstract要約: ノンサイン姿勢(ノンサインえい、英: non-sign posture)は、手話の読みに意図しない姿勢であり、有効な標識には属さない。
信頼性比はこの問題を軽減するために提案されている。
信頼性比は計算が簡単で、余分なトレーニングなしで容易に利用できる。
本稿では,タイのフィンガースペルリング認識における非符号識別の問題について,信頼度に対する代替的な定式化を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sign language is a main communication channel among hearing disability
community. Automatic sign language transcription could facilitate better
communication and understanding between hearing disability community and
hearing majority. As a recent work in automatic sign language transcription has
discussed, effectively handling or identifying a non-sign posture is one of the
key issues. A non-sign posture is a posture unintended for sign reading and
does not belong to any valid sign. A non-sign posture may arise during sign
transition or simply from an unaware posture. Confidence ratio has been
proposed to mitigate the issue. Confidence ratio is simple to compute and
readily available without extra training. However, confidence ratio is reported
to only partially address the problem. In addition, confidence ratio
formulation is susceptible to computational instability. This article proposes
alternative formulations to confidence ratio, investigates an issue of non-sign
identification for Thai Finger Spelling recognition, explores potential
solutions and has found a promising direction. Not only does this finding
address the issue of non-sign identification, it also provide some insight
behind a well-learned inference machine, revealing hidden meaning and new
interpretation of the underlying mechanism. Our proposed methods are evaluated
and shown to be effective for non-sign detection.
- Abstract(参考訳): 手話は聴覚障害者コミュニティの主要なコミュニケーションチャネルである。
自動手話文字起こしは、聴覚障害のコミュニティと聴覚の多数派の間のコミュニケーションと理解を促進する。
自動手話書き起こしにおける最近の研究として、非手話姿勢の効果的な処理や同定が重要な課題となっている。
非符号姿勢は、符号読解に意図しない姿勢であり、有効な符号に属さない。
非符号姿勢は、符号遷移中、または単に無意識姿勢から生じることがある。
信頼性比はこの問題を軽減するために提案されている。
信頼度は計算が簡単で、余分なトレーニングなしで簡単に利用できる。
しかし、信頼性比は部分的にのみ問題に対処すると報告されている。
さらに、信頼率の定式化は計算不安定性に影響を受けやすい。
本稿では,信頼度に対する代替的な定式化を提案し,タイの指スペリング認識における非符号識別の問題を調査し,潜在的な解決法を探究し,有望な方向性を見出した。
この発見は、符号識別の問題に対処するだけでなく、よく学習された推論マシンの背後にある洞察を与え、隠れた意味と基盤となるメカニズムの新たな解釈を明らかにする。
提案手法を評価し,非符号検出に有効であることを示した。
関連論文リスト
- Pose-Based Sign Language Appearance Transfer [5.839722619084469]
本稿では,手話の骨格ポーズにおいて,手話の内容を保持しながら手話の外観を伝達する手法を提案する。
このアプローチは、アイデンティティを難読化しながらポーズベースのレンダリングとサインステッチを改善する。
実験の結果,シグナ識別精度は低下するが,シグナ認識性能はわずかに低下することがわかった。
論文 参考訳(メタデータ) (2024-10-17T15:33:54Z) - Sign Language Recognition Based On Facial Expression and Hand Skeleton [2.5879170041667523]
我々は手と表情の骨格的特徴を統合した手話認識ネットワークを提案する。
表情情報を取り入れることで、手話認識の精度と堅牢性が向上する。
論文 参考訳(メタデータ) (2024-07-02T13:02:51Z) - Self-Supervised Representation Learning with Spatial-Temporal Consistency for Sign Language Recognition [96.62264528407863]
本研究では,空間的時間的整合性を通じてリッチな文脈を探索する自己教師付きコントラスト学習フレームワークを提案する。
動きと関節のモーダル性の相補性に着想を得て,手話モデルに一階動作情報を導入する。
提案手法は,4つの公開ベンチマークの広範な実験により評価され,新しい最先端性能と顕著なマージンを実現している。
論文 参考訳(メタデータ) (2024-06-15T04:50:19Z) - Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文 参考訳(メタデータ) (2024-03-26T09:25:57Z) - On the Importance of Signer Overlap for Sign Language Detection [65.26091369630547]
我々は,手話検出のための現在のベンチマークデータセットは,一般化が不十分な過度に肯定的な結果であると主張している。
我々は、現在の符号検出ベンチマークデータセットに対するシグナ重なりの影響を詳細に分析することでこれを定量化する。
我々は、重複のない新しいデータセット分割を提案し、より現実的なパフォーマンス評価を可能にします。
論文 参考訳(メタデータ) (2023-03-19T22:15:05Z) - Confidence-guided Centroids for Unsupervised Person Re-Identification [110.92876701933332]
教師なしの人物再識別(ReID)は,識別ラベルを活用せずに特徴抽出器を訓練することを目的としている。
不完全なクラスタリング結果に対する盲目的な信頼のため、学習は信頼できない疑似ラベルによって必然的に誤解される。
Confidence-Guided pseudo Label (CGL) は、サンプルが最初に割り当てられたセントロイドだけでなく、ID情報に埋め込まれる可能性のある他のセントロイドにもアプローチできるようにする。
論文 参考訳(メタデータ) (2022-11-22T00:18:54Z) - Weakly-supervised Fingerspelling Recognition in British Sign Language
Videos [85.61513254261523]
従来の指スペル認識法は、British Sign Language (BSL) に焦点を絞っていない
従来の手法とは対照的に,本手法はトレーニング用字幕の弱いアノテーションのみを使用する。
本稿では,このタスクに適応したTransformerアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-16T15:02:36Z) - Improving callsign recognition with air-surveillance data in air-traffic
communication [1.6058099298620423]
音声認識は、パイロットと航空交通管制官の間の音声通信の補助として使用できる。
エラーのリスクを最小限に抑えるためには、高精度な予測が必要である。
この結果から,着信信号を含む監視データは,発声における着信信号の認識を著しく向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2021-08-27T07:56:47Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - Novel Approach to Use HU Moments with Image Processing Techniques for
Real Time Sign Language Communication [0.0]
手話通信装置(SLC)は,手話利用者と他国との言語障壁を解決するために設計されている。
システムは選択した手話記号を84%の精度で認識できる。
論文 参考訳(メタデータ) (2020-07-20T03:10:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。