論文の概要: Recognising BSL Fingerspelling in Continuous Signing Sequences
- arxiv url: http://arxiv.org/abs/2603.19523v1
- Date: Thu, 19 Mar 2026 23:29:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.917605
- Title: Recognising BSL Fingerspelling in Continuous Signing Sequences
- Title(参考訳): 連続署名シーケンスにおけるBSLフィンガースペルの認識
- Authors: Alyssa Chan, Taein Kwon, Andrew Zisserman,
- Abstract要約: FingerspellingはBritish Sign Language(BSL)の重要なコンポーネントである
既存のBSLフィンガースペルデータセットは、規模が小さいか、時間的にも文字的にも不正確である。
我々は,反復的アノテーションフレームワークを用いて構築した大規模BSLフィンガースペルデータセットFS23Kを紹介する。
- 参考スコア(独自算出の注目度): 48.21890372724633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fingerspelling is a critical component of British Sign Language (BSL), used to spell proper names, technical terms, and words that lack established lexical signs. Fingerspelling recognition is challenging due to the rapid pace of signing and common letter omissions by native signers, while existing BSL fingerspelling datasets are either small in scale or temporally and letter-wise inaccurate. In this work, we introduce a new large-scale BSL fingerspelling dataset, FS23K, constructed using an iterative annotation framework. In addition, we propose a fingerspelling recognition model that explicitly accounts for bi-manual interactions and mouthing cues. As a result, with refined annotations, our approach halves the character error rate (CER) compared to the prior state of the art on fingerspelling recognition. These findings demonstrate the effectiveness of our method and highlight its potential to support future research in sign language understanding and scalable, automated annotation pipelines. The project page can be found at https://taeinkwon.com/projects/fs23k/.
- Abstract(参考訳): フィンガースペルはBritish Sign Language (BSL) の重要な構成要素であり、適切な名前、技術的用語、語彙記号が確立されていない単語を綴るのに使われる。
フィンガースペル認識は、ネイティブシグナーによる署名の速さと共通文字の欠落により困難であり、既存のBSLフィンガースペル認識データセットは規模が小さく、時間的にも文字的にも不正確である。
本研究では,反復的アノテーションフレームワークを用いて構築した大規模BSLフィンガースペルデータセットFS23Kを提案する。
さらに,両手動の相互作用や口の動きを明示的に考慮した指のスペル認識モデルを提案する。
その結果,アノテーションを改良することにより,従来の指先認識技術と比較して文字誤り率(CER)を半減させることができた。
これらの結果は,本手法の有効性を示し,手話理解およびスケーラブルな自動アノテーションパイプラインにおける今後の研究を支援する可能性を強調した。
プロジェクトのページはhttps://taeinkwon.com/projects/fs23k/にある。
関連論文リスト
- OpenFS: Multi-Hand-Capable Fingerspelling Recognition with Implicit Signing-Hand Detection and Frame-Wise Letter-Conditioned Synthesis [7.940141427569929]
フィンガースペル認識は聴覚と聴覚のコミュニケーションギャップを埋める上で重要な役割を担っている。
我々は,指先認識と合成のためのオープンソースアプローチであるOpenFSを開発した。
論文 参考訳(メタデータ) (2026-02-26T12:41:24Z) - Signs as Tokens: A Retrieval-Enhanced Multilingual Sign Language Generator [55.94334001112357]
テキスト入力から3Dサインアバターを自動回帰的に生成できる多言語手話モデルSigns as Tokens(SOKE)を導入する。
単語レベルの正確な記号を提供するために,外部記号辞書を組み込んだ検索強化SLG手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T18:28:09Z) - Fingerspelling within Sign Language Translation [0.9790236766474201]
Fingerspellingは、その高周波動作とオープン語彙語の使用により、手話処理の課題を提起する。
文全体の文脈において,手話翻訳モデルが指遣いをいかに理解するかを評価する。
論文 参考訳(メタデータ) (2024-08-13T17:57:14Z) - Toward American Sign Language Processing in the Real World: Data, Tasks,
and Methods [15.77894358993113]
インターネットから収集した署名ビデオを用いて,手話の自動処理について検討した。
ChicagoFSWild、ChicagoFSWild+、OpenASLの3つの大規模ASLデータセットを紹介します。
そこで本研究では,指スペル検出と検索という,実世界の指スペルベースアプリケーションを構築するための2つのタスクを提案する。
論文 参考訳(メタデータ) (2023-08-23T20:38:19Z) - Weakly-supervised Fingerspelling Recognition in British Sign Language
Videos [85.61513254261523]
従来の指スペル認識法は、British Sign Language (BSL) に焦点を絞っていない
従来の手法とは対照的に,本手法はトレーニング用字幕の弱いアノテーションのみを使用する。
本稿では,このタスクに適応したTransformerアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-16T15:02:36Z) - Automatic dense annotation of large-vocabulary sign language videos [85.61513254261523]
自動アノテーションの密度を大幅に高めるための,シンプルでスケーラブルなフレームワークを提案する。
これらのアノテーションは手話研究コミュニティをサポートするために公開されています。
論文 参考訳(メタデータ) (2022-08-04T17:55:09Z) - Fingerspelling Detection in American Sign Language [32.79935314131377]
未熟な手話ビデオで指のスペル検出のタスクを検討します。
これは、現実世界の指先認識システムを構築するための重要なステップである。
そこで本研究では,下流指先認識課題に対する検出の影響を反映したベンチマークと評価指標を提案する。
論文 参考訳(メタデータ) (2021-04-03T02:11:09Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - BSL-1K: Scaling up co-articulated sign language recognition using
mouthing cues [106.21067543021887]
ビデオデータから高品質なアノテーションを得るために,シグナリングキューの使い方を示す。
BSL-1Kデータセット(英: BSL-1K dataset)は、イギリス手話(英: British Sign Language, BSL)の集合体である。
論文 参考訳(メタデータ) (2020-07-23T16:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。