論文の概要: Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS
- arxiv url: http://arxiv.org/abs/2510.24887v1
- Date: Tue, 28 Oct 2025 18:43:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.694631
- Title: Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS
- Title(参考訳): 適切なランドマークサブセットによりLIBRASにおける分離符号の精度と5倍高速認識が可能となる
- Authors: Daniele L. V. dos Santos, Thiago B. Pereira, Carlos Eduardo G. R. Alves, Richard J. M. G. Tello, Francisco de A. Boldt, Thiago M. Paixão,
- Abstract要約: ブラジル手話(LIBRAS)における孤立信号認識のための軽量ボディランドマーク検出の有用性について検討する。
Alves et al. (2024)に比べて処理時間を5倍以上削減しながら、最先端の手法に匹敵するあるいは優れた性能を達成する。
- 参考スコア(独自算出の注目度): 0.9553529041059576
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the feasibility of using lightweight body landmark detection for the recognition of isolated signs in Brazilian Sign Language (LIBRAS). Although the skeleton-based approach by Alves et al. (2024) enabled substantial improvements in recognition performance, the use of OpenPose for landmark extraction hindered time performance. In a preliminary investigation, we observed that simply replacing OpenPose with the lightweight MediaPipe, while improving processing speed, significantly reduced accuracy. To overcome this limitation, we explored landmark subset selection strategies aimed at optimizing recognition performance. Experimental results showed that a proper landmark subset achieves comparable or superior performance to state-of-the-art methods while reducing processing time by more than 5X compared to Alves et al. (2024). As an additional contribution, we demonstrated that spline-based imputation effectively mitigates missing landmark issues, leading to substantial accuracy gains. These findings highlight that careful landmark selection, combined with simple imputation techniques, enables efficient and accurate isolated sign recognition, paving the way for scalable Sign Language Recognition systems.
- Abstract(参考訳): 本稿では,ブラジル手話(LIBRAS)における孤立信号認識のための軽量ボディランドマーク検出の有用性について検討する。
Alves et al (2024) によるスケルトンベースのアプローチは認識性能を大幅に向上させたが、ランドマーク抽出に OpenPose を用いることで時間性能を損なうことになった。
予備調査では,OpenPoseを軽量MediaPipeに置き換えるだけで処理速度が向上し,精度が大幅に低下することがわかった。
この制限を克服するため、認識性能の最適化を目的としたランドマークサブセット選択戦略について検討した。
その結果, Alves et al (2024) と比較して処理時間を5倍以上削減し, 最先端手法と同等あるいは優れた性能が得られることがわかった。
さらなる貢献として,スプラインをベースとした計算により,目立たずの問題が効果的に軽減され,精度が大幅に向上することを示した。
これらの知見は,注意的ランドマーク選択と単純な計算手法を組み合わせることで,手話認識を効果的かつ正確に行うことができ,スケーラブルな手話認識システムの実現が期待できることを示している。
関連論文リスト
- Adaptive Label Smoothing for Out-of-Distribution Detection [1.5999407512883508]
適応ラベル平滑化(ALS)と呼ばれる新しい正規化手法を提案する。
ALSは非真のクラスを同じ確率にプッシュするが、最大確率は固定でも制限でもない。
私たちのコードは一般に公開されます。
論文 参考訳(メタデータ) (2024-10-08T15:35:11Z) - Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - Skeleton-Based Human Action Recognition with Noisy Labels [43.58994208412764]
ラベルノイズはモデルのトレーニングに悪影響を及ぼし、認識品質が低下する。
NoiseEraSARは、グローバルなサンプル選択、コティーチング、クロスモーダル・ミックス・オブ・エキスパート戦略を統合している。
提案手法は,確立されたベンチマークの性能向上を実証し,新しい最先端標準を設定した。
論文 参考訳(メタデータ) (2024-03-15T02:42:28Z) - Distillation-guided Representation Learning for Unconstrained Gait Recognition [50.0533243584942]
本研究では,屋外シナリオにおける人間認証のためのGADER(GAit Detection and Recognition)フレームワークを提案する。
GADERは、歩行情報を含むフレームのみを使用する新しい歩行認識手法により識別的特徴を構築する。
室内および屋外のデータセットに一貫した改善を示すため,複数の歩行ベースライン(SoTA)について評価を行った。
論文 参考訳(メタデータ) (2023-07-27T01:53:57Z) - dugMatting: Decomposed-Uncertainty-Guided Matting [83.71273621169404]
そこで本稿では, 明確に分解された不確かさを探索し, 効率よく効率よく改善する, 分解不確実性誘導型マッチングアルゴリズムを提案する。
提案したマッチングフレームワークは,シンプルで効率的なラベリングを用いて対話領域を決定する必要性を緩和する。
論文 参考訳(メタデータ) (2023-06-02T11:19:50Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Spatio-temporal Gait Feature with Adaptive Distance Alignment [90.5842782685509]
我々は,ネットワーク構造の最適化と抽出した歩行特徴の洗練という2つの側面から,異なる被験者の歩行特徴の差を増大させようとしている。
提案手法は時空間特徴抽出(SFE)と適応距離アライメント(ADA)から構成される。
ADAは実生活における多数の未ラベルの歩行データをベンチマークとして使用し、抽出した時間的特徴を洗練し、クラス間類似度が低く、クラス内類似度が高いようにしている。
論文 参考訳(メタデータ) (2022-03-07T13:34:00Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - QuickBrowser: A Unified Model to Detect and Read Simple Object in
Real-time [3.098115480186737]
本研究では,多桁認識を1段階物体検出モデルに組み込むことにより,この検出と読み取りの問題を軽量に解決することを目的とする。
アーキテクチャ、損失関数、データ拡張、トレーニングにおけるバックボーンと修正の選択は、このメソッドを堅牢で効率的かつ高速にします。
論文 参考訳(メタデータ) (2021-02-15T05:47:40Z) - Towards End-to-end Car License Plate Location and Recognition in
Unconstrained Scenarios [0.0]
ライセンスプレートの検出と認識を同時に行うための効率的なフレームワークを提案する。
軽量で統一されたディープニューラルネットワークで、エンドツーエンドに最適化され、リアルタイムに動作する。
実験結果から,提案手法は従来の最先端手法よりも高速・高精度で優れていたことが示唆された。
論文 参考訳(メタデータ) (2020-08-25T09:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。