論文の概要: What's the Point? Spatial Grammar & Index Resolution for Sign Language Processing
- arxiv url: http://arxiv.org/abs/2606.08056v1
- Date: Sat, 06 Jun 2026 08:39:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.698894
- Title: What's the Point? Spatial Grammar & Index Resolution for Sign Language Processing
- Title(参考訳): 意味は何か?手話処理のための空間文法と指数分解能
- Authors: Oline Ranum, Simon Hadfield, Richard Bowden,
- Abstract要約: 署名内容は含まれないものの,手話認識ではインデックス化が不十分であることを示す。
我々は、索引付けの専門家を訓練し、評価するためのフレームワークを導入し、索引認識手話モデリングのベースラインを確立する。
提案手法は,空間参照分解能を指標検出と談話エンティティリンクに分解する。
- 参考スコア(独自算出の注目度): 26.260159997887815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sign language models are predominantly trained with gloss-sequence or text supervision, thereby under-modeling non-lexical and productive constructions. One comparatively tractable instance is spatial indexing: pointing gestures that assign discourse entities to spatial loci for subsequent co-reference, which lexicon-centric objectives largely fail to capture. We present a targeted evaluation of indexing in Sign Language Recognition, showing that despite comprising 10-15% of signing content, indexing is poorly recovered. We introduce a framework for training and evaluating indexing experts, establishing a baseline for index-aware sign language modeling. Our approach decomposes spatial reference resolution into index detection and discourse entity linking. The resulting mention representations enable automatic annotation and non-lexical structure modeling, and serve as an auxiliary indexing expert that augments a frozen SLR model at inference time.
- Abstract(参考訳): 手話モデルは、主にグロスシーケンスやテキストの監督で訓練され、非語彙的かつ生産的な構造をモデル化する。
比較的難解な例は空間的索引付け(spatial indexing, 空間的索引付け)である。
本稿では,手話認識における索引付けの目標評価を行い,10~15%の署名コンテンツを含むにもかかわらず,索引付けが不十分であることを示す。
我々は、索引付けの専門家を訓練し、評価するためのフレームワークを導入し、索引認識手話モデリングのベースラインを確立する。
提案手法は,空間参照分解能を指標検出と談話エンティティリンクに分解する。
結果として得られる言及表現は、自動アノテーションと非語彙構造モデリングを可能にし、推論時に凍結したSLRモデルを増強する補助インデックス化の専門家として機能する。
関連論文リスト
- Sign Spotting Disambiguation using Large Language Models [29.79050316749927]
本稿では,Large Language Models(LLMs)を統合して,符号スポッティング品質を大幅に向上させる,学習自由フレームワークを提案する。
提案手法は,グローバル・テンポラル・ハンド形状の特徴を抽出し,その特徴を大規模手話辞書と照合する。
この辞書ベースのマッチングは本質的に、モデルの再訓練を必要とせず、より優れた語彙の柔軟性を提供する。
論文 参考訳(メタデータ) (2025-07-04T16:38:09Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Compositional Generalization in Grounded Language Learning via Induced
Model Sparsity [81.38804205212425]
グリッド環境における単純な言語条件のナビゲーション問題について考察する。
本研究では,オブジェクトの指示文と属性のスパース相関を助長するエージェントを設計し,それらを組み合わせて目的を導出する。
我々のエージェントは、少数のデモンストレーションから学習した場合でも、新しいプロパティの組み合わせを含む目標に対して高いレベルのパフォーマンスを維持している。
論文 参考訳(メタデータ) (2022-07-06T08:46:27Z) - Multilingual Extraction and Categorization of Lexical Collocations with
Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。
以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文 参考訳(メタデータ) (2022-05-23T16:47:37Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - Temporal Accumulative Features for Sign Language Recognition [2.3204178451683264]
我々は,孤立した手話のジェスチャーを認識するための,効率的かつ高速なSLR手法を考案した。
また,手形情報や小規模な逐次ニューラルネットワークを用いて,言語サブユニットの累積特徴のモデリングがベースライン分類結果に基づいて改善されることを実証した。
論文 参考訳(メタデータ) (2020-04-02T19:03:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。