論文の概要: Neural Sign Language Translation by Learning Tokenization
- arxiv url: http://arxiv.org/abs/2002.00479v2
- Date: Wed, 4 Mar 2020 15:28:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 20:15:15.410815
- Title: Neural Sign Language Translation by Learning Tokenization
- Title(参考訳): 学習トークン化によるニューラル手話翻訳
- Authors: Alptekin Orbay and Lale Akarun
- Abstract要約: 本稿では,Adversarial, Multitask, Transfer Learning を用いて,ラベル付けの負担を伴わずに半教師付きトークン化手法を探索する。
提案手法は13.25 BLUE-4と36.28 ROUGEのスコアを達成し、BLUE-4の4点とROUGEの5点に改善した。
- 参考スコア(独自算出の注目度): 2.741266294612776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sign Language Translation has attained considerable success recently, raising
hopes for improved communication with the Deaf. A pre-processing step called
tokenization improves the success of translations. Tokens can be learned from
sign videos if supervised data is available. However, data annotation at the
gloss level is costly, and annotated data is scarce. The paper utilizes
Adversarial, Multitask, Transfer Learning to search for semi-supervised
tokenization approaches without burden of additional labeling. It provides
extensive experiments to compare all the methods in different settings to
conduct a deeper analysis. In the case of no additional target annotation
besides sentences, the proposed methodology attains 13.25 BLUE-4 and 36.28
ROUGE scores which improves the current state-of-the-art by 4 points in BLUE-4
and 5 points in ROUGE.
- Abstract(参考訳): 手話翻訳は最近かなりの成功を収め、聴覚障害者とのコミュニケーションが改善されることを期待している。
トークン化と呼ばれる前処理ステップは、翻訳の成功を改善する。
トークンは、教師付きデータが利用可能であれば、手話ビデオから学べる。
しかし、グロスレベルでのデータアノテーションはコストがかかり、注釈付きデータは少ない。
本稿では,Adversarial, Multitask, Transfer Learning を用いて,ラベル付けの負担を伴わずに半教師付きトークン化手法を探索する。
異なる設定のすべてのメソッドを比較し、より深い分析を行うための広範な実験を提供する。
文以外の追加の目標アノテーションがない場合,提案手法は13.25 BLUE-4および36.28 ROUGEスコアを達成し,BLUE-4の4点,ROUGEの5点に改善する。
関連論文リスト
- Transfer Learning for Cross-dataset Isolated Sign Language Recognition in Under-Resourced Datasets [2.512406961007489]
時間グラフ畳み込みに基づく手話認識手法を用いて5つの教師あり移動学習手法を評価する。
特殊な教師付き転写学習法では,ファインタニングに基づく転写学習の改善が可能であることを示す。
論文 参考訳(メタデータ) (2024-03-21T16:36:40Z) - Constrained Decoding for Cross-lingual Label Projection [27.567195418950966]
ラベル付き学習データを持たない低リソース言語では,多言語 LLM を用いた言語間移動が一般的な学習パラダイムとなっている。
しかし、単語やフレーズの微粒な予測を含むNLPタスクでは、ゼロショットの言語間移動学習は教師付き微調整法よりもはるかに遅れている。
論文 参考訳(メタデータ) (2024-02-05T15:57:32Z) - Maximizing Data Efficiency for Cross-Lingual TTS Adaptation by
Self-Supervised Representation Mixing and Embedding Initialization [57.38123229553157]
本稿では,テキスト音声合成システムにおける言語適応のための効果的な伝達学習フレームワークを提案する。
ラベル付きおよびラベルなしの最小データを用いて言語適応を実現することに注力する。
実験結果から,本フレームワークは,ラベル付きデータの4つの発声とラベル付きデータの15分で,未知の言語で理解不能な音声を合成できることが示唆された。
論文 参考訳(メタデータ) (2024-01-23T21:55:34Z) - Enhancing Machine Translation through Advanced In-Context Learning: A
Methodological Strategy for GPT-4 Improvement [10.651490542512567]
本稿では,機械翻訳に特化してコンテキスト内学習を利用する戦略的アプローチを提案し,精度を大幅に向上することを目的とした。
この手法の要点は、文脈内学習に最も効果的である実演の司法的選択にある。
本手法は,言語障壁を克服する上での文脈内学習の可能性を示し,異文化間コミュニケーションとグローバルコラボレーションのための新たな道を開く。
論文 参考訳(メタデータ) (2023-11-15T10:28:28Z) - BUFFET: Benchmarking Large Language Models for Few-shot Cross-lingual
Transfer [81.5984433881309]
本稿では,54言語にまたがる15のタスクをシーケンス・ツー・シーケンス・フォーマットで統一するBUFFETを紹介する。
BUFFETは、数発の言語間移動のための厳密で公平な評価フレームワークを確立するように設計されている。
コンテクスト内言語間移動における改善の余地は極めて大きいことが判明した。
論文 参考訳(メタデータ) (2023-05-24T08:06:33Z) - On the Importance of Signer Overlap for Sign Language Detection [65.26091369630547]
我々は,手話検出のための現在のベンチマークデータセットは,一般化が不十分な過度に肯定的な結果であると主張している。
我々は、現在の符号検出ベンチマークデータセットに対するシグナ重なりの影響を詳細に分析することでこれを定量化する。
我々は、重複のない新しいデータセット分割を提案し、より現実的なパフォーマンス評価を可能にします。
論文 参考訳(メタデータ) (2023-03-19T22:15:05Z) - Automatic dense annotation of large-vocabulary sign language videos [85.61513254261523]
自動アノテーションの密度を大幅に高めるための,シンプルでスケーラブルなフレームワークを提案する。
これらのアノテーションは手話研究コミュニティをサポートするために公開されています。
論文 参考訳(メタデータ) (2022-08-04T17:55:09Z) - Keypoint based Sign Language Translation without Glosses [7.240731862549344]
署名者の骨格点に基づく翻訳を行うための新しいキーポイント正規化法を提案する。
身体部分に応じてカスタマイズされた正規化法により性能改善に寄与した。
本手法は,グルースを使わずにデータセットに適用可能な方法で,様々なデータセットに適用することができる。
論文 参考訳(メタデータ) (2022-04-22T05:37:56Z) - Master Thesis: Neural Sign Language Translation by Learning Tokenization [0.0]
ニューラル手話翻訳(NSLT)を改善するためのマルチタスク学習手法を提案する。
トークン化のパートでは、手話(SL)ビデオを他の部分に送出する方法に重点を置いている。
すべてのトークン化手法における広範囲な実験により, 身体部位の効果を示す。
論文 参考訳(メタデータ) (2020-11-18T13:59:36Z) - Leveraging Adversarial Training in Self-Learning for Cross-Lingual Text
Classification [52.69730591919885]
本稿では,ラベル保存型入力摂動の最大損失を最小限に抑える半教師付き対向学習法を提案する。
多様な言語群に対する文書分類と意図分類において,有効性が著しく向上するのを観察する。
論文 参考訳(メタデータ) (2020-07-29T19:38:35Z) - Sign Language Transformers: Joint End-to-end Sign Language Recognition
and Translation [59.38247587308604]
本稿では,連続手話認識と翻訳を共同で学習するトランスフォーマーアーキテクチャを提案する。
RWTH-PHOENIX-Weather-2014Tデータセットの認識と翻訳性能の評価を行った。
我々の翻訳ネットワークは、動画を音声言語に、光沢を音声言語翻訳モデルに、どちらよりも優れています。
論文 参考訳(メタデータ) (2020-03-30T21:35:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。