論文の概要: Quantitative Survey of the State of the Art in Sign Language Recognition
- arxiv url: http://arxiv.org/abs/2008.09918v2
- Date: Sat, 29 Aug 2020 10:49:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 08:12:36.782414
- Title: Quantitative Survey of the State of the Art in Sign Language Recognition
- Title(参考訳): 手話認識における技術の現状に関する定量的調査
- Authors: Oscar Koller
- Abstract要約: 本研究は,400以上の実験結果が得られた約300の手話認識論文を対象としたメタスタディである。
1983年から2020年の間、ほとんどの論文が執筆された。
また、RWTH-PHOENIX-Weather 2014での認識アプローチを比較した25以上の研究を詳細に分析している。
- 参考スコア(独自算出の注目度): 7.284661356980247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents a meta study covering around 300 published sign language
recognition papers with over 400 experimental results. It includes most papers
between the start of the field in 1983 and 2020. Additionally, it covers a
fine-grained analysis on over 25 studies that have compared their recognition
approaches on RWTH-PHOENIX-Weather 2014, the standard benchmark task of the
field. Research in the domain of sign language recognition has progressed
significantly in the last decade, reaching a point where the task attracts much
more attention than ever before. This study compiles the state of the art in a
concise way to help advance the field and reveal open questions. Moreover, all
of this meta study's source data is made public, easing future work with it and
further expansion. The analyzed papers have been manually labeled with a set of
categories. The data reveals many insights, such as, among others, shifts in
the field from intrusive to non-intrusive capturing, from local to global
features and the lack of non-manual parameters included in medium and larger
vocabulary recognition systems. Surprisingly, RWTH-PHOENIX-Weather with a
vocabulary of 1080 signs represents the only resource for large vocabulary
continuous sign language recognition benchmarking world wide.
- Abstract(参考訳): 本研究は,400以上の実験結果が得られた約300の手話認識論文を対象としたメタスタディである。
1983年から2020年までのほとんどの論文が収録されている。
さらに、この分野の標準ベンチマークタスクであるrwth-phoenix-weather 2014における認識アプローチを比較した25以上の研究に関する詳細な分析も取り上げている。
手話認識分野の研究は過去10年で著しく進展し、タスクがこれまでにないほど注目を集めている。
本研究は、現場を前進させ、オープンな質問を明らかにするための簡潔な方法で芸術の状態をコンパイルする。
さらに、このメタスタディのソースデータはすべて公開されており、今後の作業の緩和とさらなる拡張が図られている。
分析された論文は、手動で分類された。
データは、侵入的から非侵入的なキャプチャー、地域的特徴からグローバルな特徴、中・大規模語彙認識システムに含まれる非手動パラメータの欠如など、多くの洞察を浮き彫りにしている。
驚くべきことに、rwth-phoenix-weatherの語彙1080の記号は、世界規模の大語彙連続手話認識ベンチマークの唯一のリソースである。
関連論文リスト
- Text Classification using Graph Convolutional Networks: A Comprehensive Survey [11.1080224302799]
グラフ畳み込みネットワーク(GCN)ベースのアプローチは、この10年間、この分野で大きな注目を集めてきた。
本研究の目的は,GCNをベースとしたテキスト分類手法をアーキテクチャや監視方法に関して要約し,分類することである。
論文 参考訳(メタデータ) (2024-10-12T07:03:42Z) - A Network Analysis Approach to Conlang Research Literature [0.0]
本稿では,コンラング研究に関する文献を総合的に理解することを目的としている。
1927年から2022年までの2300以上の学術出版物を分析したところ、エスペラントは最も文書化されたコンラングであることがわかった。
論文 参考訳(メタデータ) (2024-07-22T04:40:45Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。
音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。
本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文 参考訳(メタデータ) (2022-05-21T16:52:57Z) - Machine Translation from Signed to Spoken Languages: State of the Art
and Challenges [9.292669129832605]
我々は手話言語学と機械翻訳を高度に紹介する。
言語機械翻訳研究の肩に顕著な進歩が見られた。
我々は、学際的な研究を提唱し、手話の言語分析に関する将来の研究を基盤にしている。
論文 参考訳(メタデータ) (2022-02-07T11:54:07Z) - From Show to Tell: A Survey on Image Captioning [48.98681267347662]
視覚と言語を結びつけることは、ジェネレーティブ・インテリジェンスにおいて重要な役割を担っている。
画像キャプションの研究はまだ結論に達していない。
本研究の目的は,画像キャプション手法の包括的概要と分類を提供することである。
論文 参考訳(メタデータ) (2021-07-14T18:00:54Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - On Vocabulary Reliance in Scene Text Recognition [79.21737876442253]
ボキャブラリ内の単語を持つ画像に対して、手法は良好に機能するが、ボキャブラリ外の単語を持つ画像にはあまり一般化しない。
私たちはこの現象を「語彙依存」と呼んでいる。
本研究では,2家族のモデルが協調的に学習できるようにするための,シンプルで効果的な相互学習戦略を提案する。
論文 参考訳(メタデータ) (2020-05-08T11:16:58Z) - BosphorusSign22k Sign Language Recognition Dataset [2.064612766965483]
BosphorusSign22kは、コンピュータビジョン、ビデオ認識、ディープラーニング研究コミュニティを対象とした大規模な手話データセットである。
このデータセットの主な目的は、トルコ手話認識の新しいベンチマークとして機能することである。
我々は、手話生成など他のタスクを奨励するために、最先端の人間のポーズ推定を提供する。
論文 参考訳(メタデータ) (2020-04-02T22:15:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。