論文の概要: When Semantic Overlap Is Not Enough: Cross-Lingual Euphemism Transfer Between Turkish and English
- arxiv url: http://arxiv.org/abs/2602.16957v1
- Date: Wed, 18 Feb 2026 23:50:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.522913
- Title: When Semantic Overlap Is Not Enough: Cross-Lingual Euphemism Transfer Between Turkish and English
- Title(参考訳): セマンティック・オーバーラップが不十分な時:トルコ語と英語間の言語間共生
- Authors: Hasan Can Biyik, Libby Barak, Jing Peng, Anna Feldman,
- Abstract要約: 言語間等価性は多言語共生検出における伝達に影響を及ぼす。
トルコ語と英語では,OPET(Overlapping)サブセットとNOPET(Non-Overlapping)サブセットに分類する。
- 参考スコア(独自算出の注目度): 2.650374074056954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Euphemisms substitute socially sensitive expressions, often softening or reframing meaning, and their reliance on cultural and pragmatic context complicates modeling across languages. In this study, we investigate how cross-lingual equivalence influences transfer in multilingual euphemism detection. We categorize Potentially Euphemistic Terms (PETs) in Turkish and English into Overlapping (OPETs) and Non-Overlapping (NOPETs) subsets based on their functional, pragmatic, and semantic alignment. Our findings reveal a transfer asymmetry: semantic overlap is insufficient to guarantee positive transfer, particularly in low-resource Turkish-to-English direction, where performance can degrade even for overlapping euphemisms, and in some cases, improve under NOPET-based training. Differences in label distribution help explain these counterintuitive results. Category-level analysis suggests that transfer may be influenced by domain-specific alignment, though evidence is limited by sparsity.
- Abstract(参考訳): ユーフェミズムは社会的に敏感な表現を代用し、しばしば軟化やフレーミングの意味を持ち、その文化的・実践的な文脈への依存は言語間のモデリングを複雑にする。
本研究では,多言語共振検出における言語間等価性の影響について検討した。
トルコ語と英語では, 機能的, 実用的, 意味的アライメントに基づいて, オバラップ(OPET)サブセットと非オーバーラップ(NOPET)サブセットに分類する。
特に低リソーストルコ語から英語の方向では,重なり合うエウヘミズムでも性能が低下し,場合によってはNOPETによるトレーニングでは改善する。
ラベル分布の違いは、これらの反直感的な結果を説明するのに役立つ。
カテゴリーレベルの分析では、転送はドメイン固有のアライメントに影響される可能性があるが、証拠は空間性によって制限される。
関連論文リスト
- When Meanings Meet: Investigating the Emergence and Quality of Shared Concept Spaces during Multilingual Language Model Training [57.230355403478995]
本研究では,EuroLLMの事前学習における言語に依存しない概念空間の開発について検討する。
共有概念空間は早期に出現し、洗練され続けていますが、それらとの整合性は言語に依存しています。
従来の作業とは対照的に、細かな手作業分析により、翻訳品質の顕著な向上は、行動の変化を反映していることが判明した。
論文 参考訳(メタデータ) (2026-01-30T11:23:01Z) - Toward Understanding the Transferability of Adversarial Suffixes in Large Language Models [70.11800794130394]
離散最適化ベースのjailbreaking攻撃は、入力プロンプトに付加された非意味なサフィックスを生成することを目的としている。
素早い意味的類似性は、伝達の成功と弱い相関関係にある。
これらの知見は、我々の統計的分析が攻撃成功の実践的改善にどのように変換できるかを示すために、介入実験で使用する、伝達可能性のよりきめ細かな理解につながる。
論文 参考訳(メタデータ) (2025-10-24T20:28:49Z) - Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks [3.274367403737527]
言語間移動は現代のNLPの中心であり、モデルは訓練された言語とは異なる言語でタスクを実行することができる。
一般的な仮定は、より多くの言語でのトレーニングはゼロショット転送を改善するというものである。
本手法は,感性を考慮したタスクの多義性や語彙的意味変化で検証し,多言語性は効果的な伝達には必要ないことを見いだす。
論文 参考訳(メタデータ) (2025-05-30T17:36:20Z) - How to Handle Different Types of Out-of-Distribution Scenarios in Computational Argumentation? A Comprehensive and Fine-Grained Field Study [59.13867562744973]
この研究は、オフ・オブ・ディストリビューション(OOD)シナリオにおけるLMの能力を体系的に評価する。
このような学習パラダイムの有効性は,OODの種類によって異なることがわかった。
具体的には、ICLはドメインシフトに優れているが、プロンプトベースの微調整はトピックシフトに勝っている。
論文 参考訳(メタデータ) (2023-09-15T11:15:47Z) - FEED PETs: Further Experimentation and Expansion on the Disambiguation
of Potentially Euphemistic Terms [3.1648534725322666]
我々は,ヨルバ語,スペイン語,マンダリン中国語の3つの異なる言語で,新しいエウヘミズムコーパスを提示する。
トランスフォーマーは、あいまいなPETを分類するのが一般的である。
我々は,多言語トランスフォーマーモデルmBERTとXLM-RoBERTaを用いて,各言語でエウヘミズムの曖昧化実験を行う。
論文 参考訳(メタデータ) (2023-05-31T22:23:20Z) - Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is
It and How Does It Affect Transfer? [50.48082721476612]
マルチリンガルBERT (mBERT) は, 言語間シンタクティックな機能を示した。
我々は,mBERTから引き起こされる文法的関係の分布を,24言語に類型的に異なる文脈で検討した。
論文 参考訳(メタデータ) (2022-12-21T09:44:08Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z) - Subdiffusive semantic evolution in Indo-European languages [0.0]
セマンティック進化は5つの主要なインド・ヨーロッパ諸語に強く分散している。
単語は異常拡散指数を持つ意味空間の軌跡に従うことを示す。
さらに,データ解析と解釈において,強い部分拡散は多種多様な選択の下で頑健な現象であることを示す。
論文 参考訳(メタデータ) (2022-09-10T15:57:32Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。