論文の概要: BosphorusSign22k Sign Language Recognition Dataset
- arxiv url: http://arxiv.org/abs/2004.01283v2
- Date: Thu, 9 Apr 2020 14:07:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 13:06:06.894695
- Title: BosphorusSign22k Sign Language Recognition Dataset
- Title(参考訳): BosphorusSign22k手話認識データセット
- Authors: O\u{g}ulcan \"Ozdemir, Ahmet Alp K{\i}nd{\i}ro\u{g}lu, Necati Cihan
Camg\"oz and Lale Akarun
- Abstract要約: BosphorusSign22kは、コンピュータビジョン、ビデオ認識、ディープラーニング研究コミュニティを対象とした大規模な手話データセットである。
このデータセットの主な目的は、トルコ手話認識の新しいベンチマークとして機能することである。
我々は、手話生成など他のタスクを奨励するために、最先端の人間のポーズ推定を提供する。
- 参考スコア(独自算出の注目度): 2.064612766965483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sign Language Recognition is a challenging research domain. It has recently
seen several advancements with the increased availability of data. In this
paper, we introduce the BosphorusSign22k, a publicly available large scale sign
language dataset aimed at computer vision, video recognition and deep learning
research communities. The primary objective of this dataset is to serve as a
new benchmark in Turkish Sign Language Recognition for its vast lexicon, the
high number of repetitions by native signers, high recording quality, and the
unique syntactic properties of the signs it encompasses. We also provide
state-of-the-art human pose estimates to encourage other tasks such as Sign
Language Production. We survey other publicly available datasets and expand on
how BosphorusSign22k can contribute to future research that is being made
possible through the widespread availability of similar Sign Language
resources. We have conducted extensive experiments and present baseline results
to underpin future research on our dataset.
- Abstract(参考訳): 手話認識は困難な研究領域である。
最近、データの可用性の向上によって、いくつかの進歩が見られた。
本稿では,コンピュータビジョン,ビデオ認識,ディープラーニング研究コミュニティを対象とした大規模手話データセットであるbosphorussign22kについて紹介する。
このデータセットの主な目的は、その広大な語彙に対するトルコ手話認識の新しいベンチマーク、ネイティブシグナーによる頻繁な反復、高い記録品質、そしてそれが包含する記号のユニークな構文特性として機能することである。
我々はまた、手話生成などの他のタスクを奨励するために、最先端の人間のポーズ推定も提供する。
我々は、他の公開データセットを調査し、BosphorusSign22kが、類似のSign Languageリソースの普及を通じて可能になっている将来の研究にどのように貢献できるかを拡大する。
我々は、データセットに関する今後の研究を支えるために、広範囲にわたる実験を行い、基礎となる結果を提示した。
関連論文リスト
- iSign: A Benchmark for Indian Sign Language Processing [5.967764101493575]
iSignは、Indian Sign Language (ISL) 処理のベンチマークである。
我々は118K以上のビデオ文/フレーズペアを持つ最大のISL- Englishデータセットの1つをリリースする。
ISLの動作に関するいくつかの言語的な洞察を、提案したベンチマークに関する洞察を提供する。
論文 参考訳(メタデータ) (2024-07-07T15:07:35Z) - The First Swahili Language Scene Text Detection and Recognition Dataset [55.83178123785643]
低リソース言語、特にスワヒリ語には大きなギャップがある。
スワヒリ語は東アフリカ諸国で広く話されているが、依然としてシーンテキスト認識において未発見言語である。
本研究では,スワヒリシーンのテキスト画像の包括的データセットを提案し,異なるシーンのテキスト検出および認識モデルに基づくデータセットの評価を行う。
論文 参考訳(メタデータ) (2024-05-19T03:55:02Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文 参考訳(メタデータ) (2023-05-23T21:00:42Z) - Learning from What is Already Out There: Few-shot Sign Language
Recognition with Online Dictionaries [0.0]
UWB-SL-Wildマイクロショットデータセットをオープンソースとして公開しました。
我々は,手話認識モデルを数ショットのシナリオで訓練するための新しいアプローチを導入し,その結果,最先端の結果を得た。
論文 参考訳(メタデータ) (2023-01-10T03:21:01Z) - LSA-T: The first continuous Argentinian Sign Language dataset for Sign
Language Translation [52.87578398308052]
手話翻訳(SLT)は、人間とコンピュータの相互作用、コンピュータビジョン、自然言語処理、機械学習を含む活発な研究分野である。
本稿では,最初の連続的アルゼンチン手話(LSA)データセットを提案する。
このビデオには、CN Sordos YouTubeチャンネルから抽出されたLCAの14,880の文レベルのビデオと、各署名者のためのラベルとキーポイントアノテーションが含まれている。
論文 参考訳(メタデータ) (2022-11-14T14:46:44Z) - WLASL-LEX: a Dataset for Recognising Phonological Properties in American
Sign Language [2.814213966364155]
我々は6つの異なる音韻特性を付加したアメリカ手話記号の大規模データセットを構築した。
データ駆動のエンドツーエンドと機能ベースのアプローチが、これらの特性を自動認識するために最適化できるかどうかを検討する。
論文 参考訳(メタデータ) (2022-03-11T17:21:24Z) - Dataset Geography: Mapping Language Data to Language Users [17.30955185832338]
本研究では,NLPデータセットが言語話者の期待するニーズにどの程度一致しているかを定量化することを目的として,NLPデータセットの地理的代表性について検討する。
その際、エンティティ認識とリンクシステムを使用し、言語間の一貫性について重要な観察を行う。
最後に,観測された分布データセットを説明するための地理的・経済的要因について検討する。
論文 参考訳(メタデータ) (2021-12-07T05:13:50Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - How2Sign: A Large-scale Multimodal Dataset for Continuous American Sign
Language [37.578776156503906]
How2Signは、マルチモーダルかつマルチビューの連続した米国手話(ASL)データセットである。
80時間以上の手話ビデオの並列コーパスと、音声、英語の書き起こし、深さなどに対応する一連のモダリティから構成される。
3時間のサブセットがパノプティカル・スタジオで記録され、詳細な3Dポーズ推定が可能となった。
論文 参考訳(メタデータ) (2020-08-18T20:22:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。