論文の概要: Gloss-Free Sign Language Translation: An Unbiased Evaluation of Progress in the Field
- arxiv url: http://arxiv.org/abs/2603.13240v1
- Date: Wed, 18 Feb 2026 08:40:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.220131
- Title: Gloss-Free Sign Language Translation: An Unbiased Evaluation of Progress in the Field
- Title(参考訳): グロスフリー手話翻訳 : 分野の進歩の曖昧な評価
- Authors: Ozge Mercanoglu Sincan, Jian He Low, Sobhan Asasi, Richard Bowden,
- Abstract要約: 手話翻訳は、視覚的な手話ビデオを自動的に音声言語テキストに変換することを目的としている。
近年は急速に進歩しているが、性能改善の真の源泉はよく不明である。
本稿では,最近のGloss-free SLTモデルについて,統一フレームワークにおける重要なコントリビューションを再実装した総合的研究を行う。
- 参考スコア(独自算出の注目度): 18.404620610035174
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Sign Language Translation (SLT) aims to automatically convert visual sign language videos into spoken language text and vice versa. While recent years have seen rapid progress, the true sources of performance improvements often remain unclear. Do reported performance gains come from methodological novelty, or from the choice of a different backbone, training optimizations, hyperparameter tuning, or even differences in the calculation of evaluation metrics? This paper presents a comprehensive study of recent gloss-free SLT models by re-implementing key contributions in a unified codebase. We ensure fair comparison by standardizing preprocessing, video encoders, and training setups across all methods. Our analysis shows that many of the performance gains reported in the literature often diminish when models are evaluated under consistent conditions, suggesting that implementation details and evaluation setups play a significant role in determining results. We make the codebase publicly available here (https://github.com/ozgemercanoglu/sltbaselines) to support transparency and reproducibility in SLT research.
- Abstract(参考訳): 手話翻訳(SLT)は、視覚的な手話ビデオを自動的に音声言語テキストに変換することを目的としており、その逆も目的である。
近年は急速に進歩しているが、性能改善の真の源泉はよく不明である。
報告されたパフォーマンス向上は、方法論的なノベルティや、異なるバックボーンの選択、トレーニング最適化、ハイパーパラメータチューニング、あるいは評価指標の計算の違いによるものなのでしょうか?
本稿では,最近のGloss-free SLTモデルについて,統一コードベースにおける重要なコントリビューションを再実装した総合的研究を行う。
プリプロセッシング、ビデオエンコーダ、トレーニング設定を標準化することで、公平な比較を確保する。
分析の結果, モデルが一貫した条件下で評価されると, 文献で報告される性能向上の多くは減少し, 実装の詳細や評価設定が結果決定に重要な役割を担っていることが示唆された。
SLTリサーチの透明性と再現性をサポートするため、コードベースをここで公開しています(https://github.com/ozgemercanoglu/sltbaselines)。
関連論文リスト
- Code Review Without Borders: Evaluating Synthetic vs. Real Data for Review Recommendation [37.86790434630698]
LLM(Large Language Models)は、十分なリソースを持つ言語からのコード変更を、未表現言語や新興言語の等価な変更に変換するために用いられる。
実ラベル付きデータで訓練されたモデルと比較した。
このアプローチは、自動コードレビュー機能を急速に進化するテクノロジスタックに拡張するためのスケーラブルなパスを提供する。
論文 参考訳(メタデータ) (2025-09-05T05:17:14Z) - CAAD: Context-Aware Adaptive Decoding for Truthful Text Generation [31.469511576774252]
大規模言語モデルに対する文脈対応適応型復号法を提案する。
当社のアプローチは、TrathfulQAで平均2.8%の改善を実現しています。
モデルに依存しない,スケーラブルで,効率的な手法では,1世代パスしか必要としない。
論文 参考訳(メタデータ) (2025-08-04T08:28:25Z) - A Sober Look at Progress in Language Model Reasoning: Pitfalls and Paths to Reproducibility [47.56466996118911]
Reasoningは、言語モデル(LM)の次の主要フロンティアとして登場した。
我々は総合的な実証的研究を行い、現在の数学的推論ベンチマークは微妙な実装選択に対して非常に敏感であることがわかった。
本稿では,ベストプラクティスと報告基準を明確に定義した標準化された評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-09T17:58:17Z) - Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback [50.84142264245052]
テキストレス音声言語モデル(SLM)のセマンティック理解を強化するためのAlign-SLMフレームワークを導入する。
提案手法は、与えられたプロンプトから複数の音声継続を生成し、意味的指標を用いて、直接選好最適化(DPO)のための選好データを生成する。
語彙および構文モデリングのためのZeroSpeech 2021ベンチマーク、意味的コヒーレンスのためのStoryClozeデータセットの音声バージョン、GPT4-oスコアや人間評価などの音声生成指標を用いて、フレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-11-04T06:07:53Z) - End-to-End Evaluation for Low-Latency Simultaneous Speech Translation [55.525125193856084]
本稿では,低遅延音声翻訳の様々な側面を現実的な条件下で実行し,評価するための第1の枠組みを提案する。
これには、オーディオのセグメンテーションと、異なるコンポーネントの実行時間が含まれる。
また、このフレームワークを用いて低遅延音声翻訳の異なるアプローチを比較する。
論文 参考訳(メタデータ) (2023-08-07T09:06:20Z) - Improving Few-Shot Performance of Language Models via Nearest Neighbor
Calibration [12.334422701057674]
In-context Learning のための近辺校正フレームワークを提案する。
インコンテキスト学習パラダイムは、トレーニングインスタンスを推論する際に誤ったラベルを生成するという現象にインスパイアされている。
テキスト分類タスクの多種多様な実験により,本手法はテキスト内学習を大幅に改善することが示された。
論文 参考訳(メタデータ) (2022-12-05T12:49:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。