論文の概要: A New Dataset for End-to-End Sign Language Translation: The Greek
Elementary School Dataset
- arxiv url: http://arxiv.org/abs/2310.04753v1
- Date: Sat, 7 Oct 2023 09:18:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 15:46:23.201373
- Title: A New Dataset for End-to-End Sign Language Translation: The Greek
Elementary School Dataset
- Title(参考訳): エンドツーエンド手話翻訳のための新しいデータセット:ギリシャ小学校のデータセット
- Authors: Andreas Voskou, Konstantinos P. Panousis, Harris Partaourides,
Kyriakos Tolias and Sotirios Chatzis
- Abstract要約: ギリシャの小学校の公的なシラバスに基づく,29653のギリシア手話ビデオ翻訳ペアについて紹介する。
我々はこの新しいデータセットを用いて、手話自動翻訳研究で広く使われている最新の最先端のトランスフォーマーベースの手法を訓練する。
- 参考スコア(独自算出の注目度): 9.575895387203168
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Sign Language Translation (SLT) is a research avenue of great
societal impact. End-to-End SLT facilitates the interaction of Hard-of-Hearing
(HoH) with hearing people, thus improving their social life and opportunities
for participation in social life. However, research within this frame of
reference is still in its infancy, and current resources are particularly
limited. Existing SLT methods are either of low translation ability or are
trained and evaluated on datasets of restricted vocabulary and questionable
real-world value. A characteristic example is Phoenix2014T benchmark dataset,
which only covers weather forecasts in German Sign Language. To address this
shortage of resources, we introduce a newly constructed collection of 29653
Greek Sign Language video-translation pairs which is based on the official
syllabus of Greek Elementary School. Our dataset covers a wide range of
subjects. We use this novel dataset to train recent state-of-the-art
Transformer-based methods widely used in SLT research. Our results demonstrate
the potential of our introduced dataset to advance SLT research by offering a
favourable balance between usability and real-world value.
- Abstract(参考訳): 自動手話翻訳(automatic sign language translation, slt)は、社会に大きな影響を与える研究道である。
エンド・トゥ・エンドSLTは、聴覚障害者とハード・オブ・ヘアリング(HoH)の相互作用を促進し、社会生活と社会生活への参加機会を改善する。
しかし、この枠組みにおける研究はまだ初期段階にあり、現在の資源は特に限られている。
既存のSLT手法は翻訳能力の低いか、制限された語彙と疑わしい実世界の値のデータセットで訓練され評価される。
特徴的な例としてphoenix2014tベンチマークデータセットがあり、ドイツの手話での天気予報のみをカバーする。
この資源不足に対処するために,ギリシャ語手話ビデオ翻訳ペア29653点を新たに収集し,ギリシャ語小学校の公式シラバスに基づく。
私たちのデータセットは幅広い対象をカバーしています。
このデータセットを用いて,slt研究で広く用いられている最新の変圧器に基づく手法を学習する。
本研究は,ユーザビリティと実世界の価値のバランスを保ちながら,SLT研究を進展させるデータセットの可能性を示すものである。
関連論文リスト
- XNLIeu: a dataset for cross-lingual NLI in Basque [14.788692648660797]
本稿では、XNLIを拡張して、トランスファーラーニングのアプローチを大いに活用できる低リソース言語であるBasqueを含める。
新しいデータセットはXNLIeuと呼ばれ、最初は英語のXNLIコーパスをバスクに機械翻訳し、続いて手動で編集後のステップで開発された。
論文 参考訳(メタデータ) (2024-04-10T13:19:56Z) - gaHealth: An English-Irish Bilingual Corpus of Health Data [2.3568264786920787]
gaHealthはアイルランド語の健康データの最初のバイリンガルコーパスである。
GaHealth corpus を用いて開発されたモデルは、トップパフォーマンスモデルと比較して最大22.2ポイント (40%) のBLEUスコアの改善を示した。
論文 参考訳(メタデータ) (2024-03-06T09:36:36Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and
Languages [87.5457337866383]
画像認識言語理解評価ベンチマークについて紹介する。
IGLUEは、視覚的質問応答、クロスモーダル検索、グラウンドド推論、20言語にわたるグラウンドドエンターテイメントタスクをまとめて提供する。
翻訳-テストの転送はゼロショットの転送よりも優れており、少数ショットの学習は多くのタスクに役立てることが難しい。
論文 参考訳(メタデータ) (2022-01-27T18:53:22Z) - Text-Based Person Search with Limited Data [66.26504077270356]
テキストベースの人物検索(TBPS)は、画像ギャラリーから対象人物を記述的なテキストクエリで検索することを目的としている。
限られたデータによってもたらされる問題に対処する2つの新しいコンポーネントを持つフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:20:47Z) - Mr. TyDi: A Multi-lingual Benchmark for Dense Retrieval [51.004601358498135]
Mr. TyDiは、11の類型的多様言語における単言語検索のためのベンチマークデータセットである。
このリソースの目的は、非英語言語における高密度検索技術の研究を促進することである。
論文 参考訳(メタデータ) (2021-08-19T16:53:43Z) - Improving Sign Language Translation with Monolingual Data by Sign
Back-Translation [105.83166521438463]
本稿では,手話テキストを手話訓練に組み込んだ手話逆翻訳(SignBT)手法を提案する。
テキストからグロスへの翻訳モデルを用いて、まずモノリンガルテキストをそのグロスシーケンスに逆変換する。
そして、推定グロス・トゥ・サインバンクから特徴レベルで部品をスプライシングしてペアサインシーケンスを生成する。
論文 参考訳(メタデータ) (2021-05-26T08:49:30Z) - DiS-ReX: A Multilingual Dataset for Distantly Supervised Relation
Extraction [15.649929244635269]
これらの問題を緩和する新しいデータセットであるDiS-ReXを提案する。
私たちのデータセットには150万以上の文があり、36の関連クラスを持つ4つの言語にまたがっている。
また,mBERTを用いて文を符号化し,多言語DS-REのベンチマーク結果を提供する。
論文 参考訳(メタデータ) (2021-04-17T22:44:38Z) - OCNLI: Original Chinese Natural Language Inference [21.540733910984006]
我々は,中国における最初の大規模NLIデータセット(56,000の注釈付き文対からなる)であるOriginal Chinese Natural Language Inference dataset(OCNLI)を提示する。
NLIを他の言語に拡張しようとする最近の試みとは異なり、私たちのデータセットは自動翻訳や非専門家アノテーションに依存していません。
我々は、中国語の最先端の事前訓練モデルを用いて、データセット上でいくつかのベースライン結果を確立し、人間のパフォーマンスよりもはるかに優れたパフォーマンスモデルを見つける。
論文 参考訳(メタデータ) (2020-10-12T04:25:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。