Fugu-MT 論文翻訳(概要): SyriSign: A Parallel Corpus for Arabic Text to Syrian Arabic Sign Language Translation

論文の概要: SyriSign: A Parallel Corpus for Arabic Text to Syrian Arabic Sign Language Translation

arxiv url: http://arxiv.org/abs/2603.29219v1
Date: Tue, 31 Mar 2026 03:33:20 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-01 15:25:03.08415
Title: SyriSign: A Parallel Corpus for Arabic Text to Syrian Arabic Sign Language Translation
Title（参考訳）: SyriSign: アラビア語をシリア語に翻訳するためのパラレルコーパス
Authors: Mohammad Amer Khalil, Raghad Nahas, Ahmad Nassar, Khloud Al Jallad,
Abstract要約: シリア・アラビア手話(SyArSL)のデータセットは公開されていない。我々はSyriSignについて紹介する。SyriSignは150の語彙記号からなる1500のビデオサンプルからなるデータセットで、SyriSignはテキストからSyArSLへの翻訳タスク用に設計されている。この研究はシリアにおけるコミュニケーション障壁を減らすことを目的としており、ほとんどのニュースはアラビア語やアラビア語で書かれており、聴覚障害のコミュニティにはアクセスできないことが多い。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Sign language is the primary approach of communication for the Deaf and Hard-of-Hearing (DHH) community. While there are numerous benchmarks for high-resource sign languages, low-resource languages like Arabic remain underrepresented. Currently, there is no publicly available dataset for Syrian Arabic Sign Language (SyArSL). To overcome this gap, we introduce SyriSign, a dataset comprising 1500 video samples across 150 unique lexical signs, designed for text-to-SyArSL translation tasks. This work aims to reduce communication barriers in Syria, as most news are delivered in spoken or written Arabic, which is often inaccessible to the deaf community. We evaluated SyriSign using three deep learning architectures: MotionCLIP for semantic motion generation, T2M-GPT for text-conditioned motion synthesis, and SignCLIP for bilingual embedding alignment. Experimental results indicate that while generative approaches show strong potential for sign representation, the limited dataset size constrains generalization performance. We will release SyriSign publicly, hoping it serves as an initial benchmark.
Abstract（参考訳）: 手話は、聴覚障害と難聴(DHH)コミュニティにおけるコミュニケーションの第一のアプローチである。高リソースの手話のベンチマークは多数あるが、アラビア語のような低リソースの言語はいまだに不足している。現在、シリア・アラビア手話(SyArSL)のデータセットは公開されていない。このギャップを克服するために、SyriSignを紹介した。SyriSignは150のユニークな語彙記号からなる1500のビデオサンプルからなるデータセットで、テキストからSyArSL翻訳タスク用に設計されている。この研究はシリアにおけるコミュニケーション障壁を減らすことを目的としており、ほとんどのニュースはアラビア語やアラビア語で書かれており、聴覚障害のコミュニティにはアクセスできないことが多い。我々はSyriSignを3つのディープラーニングアーキテクチャを用いて評価した: MotionCLIP for semantic motion generation, T2M-GPT for text-conditioned motion synthesis, and SignCLIP for bilingual embedded alignment。実験結果から、生成的アプローチは手話表現の強い可能性を示す一方で、限られたデータセットサイズは一般化性能を制約することが示された。私たちはSyriSignを公開し、最初のベンチマークとして機能することを望んでいます。

関連論文リスト

Lost in Translation, Found in Embeddings: Sign Language Translation and Alignment [84.39962912136525]
我々は手話翻訳(SLT)と手話字幕アライメント(SSA)を実行する手話理解モデルを開発する。 i)人間のキーポイントと唇領域の画像から手動と非手動のキューをキャプチャする軽量な視覚バックボーン,(ii)連続的な視覚特徴を単語レベルの埋め込みに集約するスライディングパーシーバーマッピングネットワーク,(iii)SLTとSSAを協調的に最適化するマルチタスクスケーラブルなトレーニング戦略である。
論文参考訳（メタデータ） (2025-12-08T21:05:46Z)
IsoSignVid2Aud: Sign Language Video to Audio Conversion without Text Intermediaries [0.0]
音声言語への手話翻訳は、聴覚障害者と音声障害者を繋ぐ上で重要である。我々は連続的な文法的な署名よりも、孤立した手話列を持つ手話ビデオを考える。 IsoSignVid2Audは手話ビデオの非文法的連続符号列を音声に変換する新しいエンドツーエンドフレームワークである。
論文参考訳（メタデータ） (2025-10-09T06:29:59Z)
Signs as Tokens: A Retrieval-Enhanced Multilingual Sign Language Generator [55.94334001112357]
テキスト入力から3Dサインアバターを自動回帰的に生成できる多言語手話モデルSigns as Tokens(SOKE)を導入する。単語レベルの正確な記号を提供するために,外部記号辞書を組み込んだ検索強化SLG手法を提案する。
論文参考訳（メタデータ） (2024-11-26T18:28:09Z)
iSign: A Benchmark for Indian Sign Language Processing [5.967764101493575]
iSignは、Indian Sign Language (ISL) 処理のベンチマークである。我々は118K以上のビデオ文/フレーズペアを持つ最大のISL- Englishデータセットの1つをリリースする。 ISLの動作に関するいくつかの言語的な洞察を、提案したベンチマークに関する洞察を提供する。
論文参考訳（メタデータ） (2024-07-07T15:07:35Z)
A Simple Baseline for Spoken Language to Sign Language Translation with 3D Avatars [49.60328609426056]
Spoken2Signは、音声言語を手話に変換するシステムである。本稿では,グロスビデオ辞書の作成,サインビデオ毎の3Dサインの推定,スポンケン2サインモデルのトレーニングという3つのステップからなる単純なベースラインを提案する。私たちが知っている限りでは、最初にSpken2Signタスクを3Dサインの出力フォーマットで提示します。
論文参考訳（メタデータ） (2024-01-09T18:59:49Z)
The Sem-Lex Benchmark: Modeling ASL Signs and Their Phonemes [6.0179345110920455]
本稿では,ASL(American Sign Language)モデリングのための新しいリソースであるSem-Lex Benchmarkを紹介する。 Benchmarkは、現在最大規模で、聴覚障害のASL署名者による84万本以上の単独のサイン制作のビデオで構成されており、インフォームド・コンセントが与えられ、補償を受けた。 ASL-LEXにおける言語情報を活用する一連の実験を行い、Sem-Lex Benchmark(ISR)の実用性と公正性を評価した。
論文参考訳（メタデータ） (2023-09-30T00:25:43Z)
SimulSLT: End-to-End Simultaneous Sign Language Translation [55.54237194555432]
既存の手話翻訳手法では、翻訳を開始する前にすべてのビデオを読む必要がある。我々は,最初のエンドツーエンド同時手話翻訳モデルであるSimulSLTを提案する。 SimulSLTは最新のエンドツーエンドの非同時手話翻訳モデルを超えるBLEUスコアを達成する。
論文参考訳（メタデータ） (2021-12-08T11:04:52Z)
BSL-1K: Scaling up co-articulated sign language recognition using mouthing cues [106.21067543021887]
ビデオデータから高品質なアノテーションを得るために,シグナリングキューの使い方を示す。 BSL-1Kデータセット(英: BSL-1K dataset)は、イギリス手話(英: British Sign Language, BSL)の集合体である。
論文参考訳（メタデータ） (2020-07-23T16:59:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。