論文の概要: Lexical Substitution is not Synonym Substitution: On the Importance of Producing Contextually Relevant Word Substitutes
- arxiv url: http://arxiv.org/abs/2502.04173v1
- Date: Thu, 06 Feb 2025 16:05:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:33:02.069983
- Title: Lexical Substitution is not Synonym Substitution: On the Importance of Producing Contextually Relevant Word Substitutes
- Title(参考訳): 語彙置換は同義語置換ではない:文脈関連語置換の創造の重要性について
- Authors: Juraj Vladika, Stephen Meisenbacher, Florian Matthes,
- Abstract要約: モデルに送信された文脈情報を強化するために,原文を利用した単純な拡張手法であるConCatを導入する。
本研究は,文の類似度とタスクパフォーマンスを指標とした定量的評価を含む。
また,従来手法とは対照的に,利用者が提案した代替品を優先することを示す定性的な人間分析を行った。
- 参考スコア(独自算出の注目度): 5.065947993017158
- License:
- Abstract: Lexical Substitution is the task of replacing a single word in a sentence with a similar one. This should ideally be one that is not necessarily only synonymous, but also fits well into the surrounding context of the target word, while preserving the sentence's grammatical structure. Recent advances in Lexical Substitution have leveraged the masked token prediction task of Pre-trained Language Models to generate replacements for a given word in a sentence. With this technique, we introduce ConCat, a simple augmented approach which utilizes the original sentence to bolster contextual information sent to the model. Compared to existing approaches, it proves to be very effective in guiding the model to make contextually relevant predictions for the target word. Our study includes a quantitative evaluation, measured via sentence similarity and task performance. In addition, we conduct a qualitative human analysis to validate that users prefer the substitutions proposed by our method, as opposed to previous methods. Finally, we test our approach on the prevailing benchmark for Lexical Substitution, CoInCo, revealing potential pitfalls of the benchmark. These insights serve as the foundation for a critical discussion on the way in which Lexical Substitution is evaluated.
- Abstract(参考訳): レキシカル置換(Lexical Substitution)は、文中の1つの単語を同じ単語に置き換える作業である。
これは理想的には、必ずしも同義語であるだけでなく、文の文法構造を保ちながら、対象単語の周囲の文脈にも適している。
語彙置換の最近の進歩は、文中のある単語の置換を生成するために、事前訓練された言語モデルのマスク付きトークン予測タスクを活用している。
この手法により,モデルに送信された文脈情報を強化するために,原文を利用した単純な拡張手法であるConCatを導入する。
既存手法と比較して,対象語に対する文脈的関連性のある予測を行うためにモデルを導くのは非常に効果的であることが証明されている。
本研究は,文の類似度とタスクパフォーマンスを指標とした定量的評価を含む。
また,従来手法とは対照的に,利用者が提案した代替品を優先することを示す定性的な人間分析を行った。
最後に、我々はLexical Substitution, CoInCoの一般的なベンチマークにアプローチを試行し、ベンチマークの潜在的な落とし穴を明らかにした。
これらの知見は、語彙代替が評価される方法に関する批判的な議論の基盤となる。
関連論文リスト
- Learning to Substitute Words with Model-based Score Ranking [17.46170699645023]
スマートワード置換は、単語選択を改善することによって文質を向上させることを目的としている。
現在のベンチマークは、人間のラベル付きデータに依存している。
文質の定量化にはモデルベーススコア(BARTScore)を用いる。
論文 参考訳(メタデータ) (2025-02-09T15:26:32Z) - Analyzing Semantic Change through Lexical Replacements [2.509907053583601]
テクトテックス置換による予期せぬ文脈の影響について検討する。
そこで本研究では,テキスト置換方式を提案する。
セマンティックチェンジ検出におけるLLaMaの使用を最初に評価した。
論文 参考訳(メタデータ) (2024-04-29T10:20:41Z) - ParaLS: Lexical Substitution via Pretrained Paraphraser [18.929859707202517]
本研究では,代用候補をパラフラザーから生成する方法を検討する。
本稿では,デコード中の対象単語の変動に着目した2つの簡単なデコード戦略を提案する。
論文 参考訳(メタデータ) (2023-05-14T12:49:16Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Unsupervised Lexical Substitution with Decontextualised Embeddings [48.00929769805882]
事前学習された言語モデルを用いた語彙置換の新しい教師なし手法を提案する。
本手法は,文脈的および非文脈的単語埋め込みの類似性に基づいて代用語を検索する。
我々は、英語とイタリア語で実験を行い、我々の手法が強いベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-09-17T03:51:47Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - LexSubCon: Integrating Knowledge from Lexical Resources into Contextual
Embeddings for Lexical Substitution [76.615287796753]
本稿では,コンテキスト埋め込みモデルに基づくエンドツーエンドの語彙置換フレームワークであるLexSubConを紹介する。
これは文脈情報と構造化語彙資源からの知識を組み合わせることで達成される。
我々の実験によると、LexSubConはLS07とCoInCoベンチマークデータセットで従来の最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-11T21:25:56Z) - Swords: A Benchmark for Lexical Substitution with Improved Data Coverage
and Quality [126.55416118361495]
語彙置換のための新しいベンチマークを新たにリリースし、コンテキスト内でターゲット単語の適切な代用語を見つける。
我々は、文脈のないシソーラスを用いて候補を生成し、文脈的適切性を決定するために人間の判断に依存する。
これまでの最大のベンチマークと比較すると、我々のSwordsベンチマークは、同じ品質の単語に対して、ターゲットワード当たり4.1倍の代替品を持ち、その代替品は、同じ数の代用品に対して1.5倍(人間の判断に基づいて)適している。
論文 参考訳(メタデータ) (2021-06-08T04:58:29Z) - Neural Syntactic Preordering for Controlled Paraphrase Generation [57.5316011554622]
私たちの研究は、構文変換を使用して、ソース文をソフトに"リオーダー"し、神経パラフレージングモデルをガイドします。
まず、入力文が与えられた場合、エンコーダ・デコーダモデルを用いて、実行可能な構文再構成のセットを導出する。
次に、提案した各再構成を用いて位置埋め込みのシーケンスを生成し、最終的なエンコーダ-デコーダパラフレーズモデルが特定の順序でソース語に従属することを奨励する。
論文 参考訳(メタデータ) (2020-05-05T09:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。