論文の概要: Introducing A Bangla Sentence - Gloss Pair Dataset for Bangla Sign Language Translation and Research
- arxiv url: http://arxiv.org/abs/2511.08507v1
- Date: Wed, 12 Nov 2025 02:02:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.844247
- Title: Introducing A Bangla Sentence - Gloss Pair Dataset for Bangla Sign Language Translation and Research
- Title(参考訳): Bangla Sentenceの導入 - Bangla手話翻訳と研究のためのGloss Pairデータセット
- Authors: Neelavro Saha, Rafi Shahriyar, Nafis Ashraf Roudra, Saadman Sakib, Annajiat Alim Rasel,
- Abstract要約: そこで,Bangla-SGPについて紹介する。
我々のデータセットは1000の高品質なBangla文からなり、プロのシグナーによって手動でグロスシーケンスに注釈付けされる。
- 参考スコア(独自算出の注目度): 0.4077787659104315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bangla Sign Language (BdSL) translation represents a low-resource NLP task due to the lack of large-scale datasets that address sentence-level translation. Correspondingly, existing research in this field has been limited to word and alphabet level detection. In this work, we introduce Bangla-SGP, a novel parallel dataset consisting of 1,000 human-annotated sentence-gloss pairs which was augmented with around 3,000 synthetically generated pairs using syntactic and morphological rules through a rule-based Retrieval-Augmented Generation (RAG) pipeline. The gloss sequences of the spoken Bangla sentences are made up of individual glosses which are Bangla sign supported words and serve as an intermediate representation for a continuous sign. Our dataset consists of 1000 high quality Bangla sentences that are manually annotated into a gloss sequence by a professional signer. The augmentation process incorporates rule-based linguistic strategies and prompt engineering techniques that we have adopted by critically analyzing our human annotated sentence-gloss pairs and by working closely with our professional signer. Furthermore, we fine-tune several transformer-based models such as mBart50, Google mT5, GPT4.1-nano and evaluate their sentence-to-gloss translation performance using BLEU scores, based on these evaluation metrics we compare the model's gloss-translation consistency across our dataset and the RWTH-PHOENIX-2014T benchmark.
- Abstract(参考訳): Bangla Sign Language (BdSL) 翻訳は、文レベルの翻訳に対処する大規模なデータセットがないため、低リソースのNLPタスクを表す。
それに対応して、この分野での既存の研究は、単語とアルファベットレベルの検出に限られている。
本研究では,約3,000の合成規則と形態素規則を用いて,規則に基づくレトリーバル・拡張生成(RAG)パイプラインを用いて,約3,000の合成規則を付加した,1000の人文-グロスペアからなる新しい並列データセットであるBangla-SGPを紹介する。
音声バングラ文のグロスシーケンスは、バングラ記号支持語である個々のグルースから構成され、連続符号の中間表現として機能する。
我々のデータセットは1000の高品質なBangla文からなり、プロのシグナーによって手動でグロスシーケンスに注釈付けされる。
この拡張プロセスには、ルールベースの言語戦略と、人間の注釈付き文-舌ペアを批判的に分析し、プロのシグナーと密接に協力することで採用したエンジニアリング技術が組み込まれている。
さらに,mBart50, Google mT5, GPT4.1-nanoなどのトランスフォーマーベースモデルを微調整し,BLEUスコアを用いた文間翻訳性能の評価を行った。
関連論文リスト
- Continuous Bangla Sign Language Translation: Mitigating the Expense of Gloss Annotation with the Assistance of Graph [0.8192907805418583]
話し言葉を優先する社会では、手話はしばしば過小評価に直面し、社会的排除につながる。
Continuous Bangla Sign Language Translationプロジェクトは、翻訳方法を強化することで、このギャップに対処することを目的としている。
私たちのコントリビューションには、アーキテクチャの融合、さまざまな融合戦略の探索、さまざまな手話データセット上での新たな最先端のパフォーマンスの実現などが含まれています。
論文 参考訳(メタデータ) (2025-08-14T14:32:31Z) - SLRTP2025 Sign Language Production Challenge: Methodology, Results, and Future Work [87.9341538630949]
第1回手話生産チャレンジはCVPR 2025で第3回SLRTPワークショップの一環として開催された。
コンペティションの目的は、音声言語文からスケルトンポーズのシーケンスに変換するアーキテクチャを評価することである。
本稿では,挑戦設計と入賞方法について述べる。
論文 参考訳(メタデータ) (2025-08-09T11:57:33Z) - Lost in Translation, Found in Context: Sign Language Translation with Contextual Cues [56.038123093599815]
我々の目的は、連続手話から音声言語テキストへの翻訳である。
署名ビデオと追加のコンテキストキューを組み込む。
文脈的アプローチが翻訳の質を著しく向上させることを示す。
論文 参考訳(メタデータ) (2025-01-16T18:59:03Z) - Gloss-free Sign Language Translation: Improving from Visual-Language
Pretraining [56.26550923909137]
Gloss-Free Sign Language Translation (SLT) はドメイン横断性のために難しい課題である。
視覚言語事前学習(GFSLT-)に基づく新しいGross-free SLTを提案する。
i) コントラスト言語-画像事前学習とマスク付き自己教師付き学習を統合して,視覚的表現とテキスト的表現のセマンティックギャップをブリッジするプレタスクを作成し,マスク付き文を復元すること,(ii) 事前訓練されたビジュアルおよびテキストデコーダのパラメータを継承するエンコーダ-デコーダ-のような構造を持つエンドツーエンドアーキテクチャを構築すること,である。
論文 参考訳(メタデータ) (2023-07-27T10:59:18Z) - On Evaluation of Bangla Word Analogies [0.8658596218544772]
本稿では,Bangla単語の埋め込み品質を評価するための高品質なデータセットを提案する。
世界で7番目に普及した言語であるにもかかわらず、Banglaは低リソース言語であり、人気のあるNLPモデルはうまく機能しない。
論文 参考訳(メタデータ) (2023-04-10T14:27:35Z) - BanglaParaphrase: A High-Quality Bangla Paraphrase Dataset [3.922582192616519]
そこで我々は,新しいフィルタパイプラインによって構築された高品質なBangla ParaphraseデータセットであるBanglaParaphraseを提案する。
我々は,BanglaParaphraseの導入を通じて,NLPドメインにおけるBangla言語の低リソース状態を軽減するための一歩を踏み出したい。
論文 参考訳(メタデータ) (2022-10-11T02:52:31Z) - Changing the Representation: Examining Language Representation for
Neural Sign Language Production [43.45785951443149]
ニューラルサイン言語生産パイプラインの第1ステップに自然言語処理技術を適用した。
BERTやWord2Vecといった言語モデルを使って文レベルの埋め込みを改善する。
本稿では,HamNoSys(T2H)翻訳にテキストを導入し,手話翻訳に音声表現を用いることの利点を示す。
論文 参考訳(メタデータ) (2022-09-16T12:45:29Z) - Improving Sign Language Translation with Monolingual Data by Sign
Back-Translation [105.83166521438463]
本稿では,手話テキストを手話訓練に組み込んだ手話逆翻訳(SignBT)手法を提案する。
テキストからグロスへの翻訳モデルを用いて、まずモノリンガルテキストをそのグロスシーケンスに逆変換する。
そして、推定グロス・トゥ・サインバンクから特徴レベルで部品をスプライシングしてペアサインシーケンスを生成する。
論文 参考訳(メタデータ) (2021-05-26T08:49:30Z) - Data Augmentation for Sign Language Gloss Translation [115.13684506803529]
手話翻訳(SLT)は、しばしばビデオ-グロス認識とグロス-テキスト翻訳に分解される。
ここでは低リソースのニューラルネットワーク翻訳(NMT)問題として扱うグロス・トゥ・テキスト翻訳に焦点を当てる。
そこで得られた合成データの事前学習により、アメリカ手話(ASL)から英語、ドイツ語手話(DGS)からドイツ語への翻訳を、それぞれ3.14および2.20BLEUまで改善した。
論文 参考訳(メタデータ) (2021-05-16T16:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。