論文の概要: G-IdiomAlign: A Gloss-Pivoted Benchmark for Cross-Lingual Idiom Alignment
- arxiv url: http://arxiv.org/abs/2606.18989v1
- Date: Wed, 17 Jun 2026 12:09:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.155124
- Title: G-IdiomAlign: A Gloss-Pivoted Benchmark for Cross-Lingual Idiom Alignment
- Title(参考訳): G-IdiomAlign: 言語間IdiomアライメントのためのGloss-Pivotedベンチマーク
- Authors: Fengying Ye, Yanming Sun, Runzhe Zhan, Zheqi Zhang, Lidia S. Chao, Derek F. Wong,
- Abstract要約: We present G-IdiomAlign, a gloss-ed benchmark where each idiom are anchored by a English gloss from Wiktionary。
G-IdiomAlignは,(1)非グロスとWith-glosの入力を対比したGloss-Contrastive Generationと,(2)非グロスとWith-glosの2つのプロトコルをサポートし,明示的なセマンティックピボットの効果を分離する。
- 参考スコア(独自算出の注目度): 37.72396108456943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Idioms are difficult to transfer across languages due to their non-compositionality and weak surface-form grounding, making literal mappings unreliable. We present G-IdiomAlign, a gloss-pivoted benchmark where each idiom is anchored by an English gloss from Wiktionary. We further construct a high-confidence reference alignment set for reproducible evaluation. G-IdiomAlign supports two protocols: (1) a controlled Multiple-Choice Idiom Equivalence with typed distractors for error attribution; and (2) a Gloss-Contrastive Generation contrasting No-gloss and With-gloss inputs to isolate the effect of an explicit semantic pivot. Across diverse LLMs, a bias to literal translation is a dominant failure mode, especially when the target is a low-resource language. Glosses consistently improve Gloss-Contrastive Generation under an embedding-based semantic proxy, but performance remains modest, indicating substantial headroom in the open output space. Subsequent analysis on Qwen3-8B further suggests that cross-condition differences are concentrated more in attention heads than in layers, while better With-gloss generations coincide with stronger gloss anchoring.
- Abstract(参考訳): 慣用句は非合成性や表面形状の弱い接地のため言語間での移動が困難であり、リテラルマッピングは信頼できない。
我々は、G-IdiomAlignというGloss-pivotedベンチマークを示し、各イディオムはWiktionaryの英語の光沢によって固定される。
さらに,再現性評価のための高信頼基準アライメントセットを構築した。
G-IdiomAlign は,(1) 誤り帰属のための型付きイントラクタによる制御されたマルチコースイディオム等価性,(2) 明示的なセマンティックピボットの効果を分離するために,No-glos と With-glos の入力を対比したGloss-Contrastive Generation をサポートする。
多様なLLM全体において、リテラル翻訳へのバイアスは、特にターゲットが低リソース言語である場合、主要な障害モードである。
Glossesは埋め込みベースのセマンティックプロキシの下でGross-Contrastive Generationを継続的に改善するが、パフォーマンスは控えめであり、オープンな出力空間におけるかなりのヘッドルームを示している。
その後のQwen3-8B分析では、層よりもクロスコンディションの違いの方が注目度が高いことが示唆された。
関連論文リスト
- A Finetuned SpeechLLM for Joint Multi-Granular L2 Assessment and Natural-Language Rationales [8.300738063140129]
本稿では,マルチアスペクト・マルチグラニュラーアセスメントのためのルーリック誘導型SpeechLLMを提案する。
このモデルは、文レベル(正確性、流布度、韻律)、単語/音素レベルの精度を共同で予測し、同じ応答で自然言語の論理を生成する。
論文 参考訳(メタデータ) (2026-06-08T13:27:40Z) - Bridging Sign and Spoken Languages: Pseudo Gloss Generation for Sign Language Translation [48.20483623444857]
手話翻訳は、手話動画を音声テキストにマッピングすることを目的としている。
一般的なアプローチは、中間表現としてのグロスアノテーションに依存している。
そこで我々は,人間に注釈付けされたグルースを不要とした光沢のない擬似グルース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T12:19:55Z) - Fantastic Semantics and Where to Find Them: Investigating Which Layers of Generative LLMs Reflect Lexical Semantics [50.982315553104975]
本稿では,Llama2という人気言語モデルに対する語彙意味論のボトムアップ進化について検討する。
実験の結果,下位層の表現は語彙的意味論を符号化しているが,上位層はより弱い意味帰納的帰納的帰納的帰納的帰納的帰納的帰納的帰属的帰属的帰属的帰属的存在であることがわかった。
これは、高層層がより良い語彙意味論を得るマスク言語モデリングのような差別的な目的を持つモデルとは対照的である。
論文 参考訳(メタデータ) (2024-03-03T13:14:47Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Data Augmentation for Sign Language Gloss Translation [115.13684506803529]
手話翻訳(SLT)は、しばしばビデオ-グロス認識とグロス-テキスト翻訳に分解される。
ここでは低リソースのニューラルネットワーク翻訳(NMT)問題として扱うグロス・トゥ・テキスト翻訳に焦点を当てる。
そこで得られた合成データの事前学習により、アメリカ手話(ASL)から英語、ドイツ語手話(DGS)からドイツ語への翻訳を、それぞれ3.14および2.20BLEUまで改善した。
論文 参考訳(メタデータ) (2021-05-16T16:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。