論文の概要: Unsupervised Candidate Ranking for Lexical Substitution via Holistic Sentence Semantics
- arxiv url: http://arxiv.org/abs/2509.11513v1
- Date: Mon, 15 Sep 2025 01:57:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.120431
- Title: Unsupervised Candidate Ranking for Lexical Substitution via Holistic Sentence Semantics
- Title(参考訳): 完全文セマンティックスによる語彙置換のための教師なし候補ランク付け
- Authors: Zhongyang Hu, Naijie Gu, Xiangzhi Tao, Tianhui Gu, Yibing Zhou,
- Abstract要約: 語彙置換におけるキーサブタスクは、与えられた候補単語をランク付けする。
本稿では,原文と代用文のセマンティックな類似性を取り入れ,候補をランク付けする2つの手法を提案する。
LS07とSWORDSデータセットの実験では、両方のアプローチがランク付け性能を改善することが示されている。
- 参考スコア(独自算出の注目度): 2.4367870496223363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A key subtask in lexical substitution is ranking the given candidate words. A common approach is to replace the target word with a candidate in the original sentence and feed the modified sentence into a model to capture semantic differences before and after substitution. However, effectively modeling the bidirectional influence of candidate substitution on both the target word and its context remains challenging. Existing methods often focus solely on semantic changes at the target position or rely on parameter tuning over multiple evaluation metrics, making it difficult to accurately characterize semantic variation. To address this, we investigate two approaches: one based on attention weights and another leveraging the more interpretable integrated gradients method, both designed to measure the influence of context tokens on the target token and to rank candidates by incorporating semantic similarity between the original and substituted sentences. Experiments on the LS07 and SWORDS datasets demonstrate that both approaches improve ranking performance.
- Abstract(参考訳): 語彙置換におけるキーサブタスクは、与えられた候補単語をランク付けする。
一般的なアプローチは、ターゲットの単語を元の文の候補に置き換え、修正された文をモデルに入力し、置換前後の意味的差異を捉えることである。
しかし、候補置換の双方向的影響を目的語とその文脈の両方に効果的にモデル化することは依然として困難である。
既存の手法では、ターゲット位置のセマンティックな変化にのみ焦点をあてたり、複数の評価指標にパラメータチューニングを頼ったりすることがよくあり、セマンティックな変化を正確に特徴づけることは困難である。
注意重みに基づく手法と、より解釈可能な統合勾配法を応用した2つの手法について検討し、それぞれが目的トークンに対する文脈トークンの影響を計測し、元の文と置換文の意味的類似性を取り入れて候補をランク付けする。
LS07とSWORDSデータセットの実験では、両方のアプローチがランク付け性能を改善することが示されている。
関連論文リスト
- Lexical Substitution is not Synonym Substitution: On the Importance of Producing Contextually Relevant Word Substitutes [5.065947993017158]
モデルに送信された文脈情報を強化するために,原文を利用した単純な拡張手法であるConCatを導入する。
本研究は,文の類似度とタスクパフォーマンスを指標とした定量的評価を含む。
また,従来手法とは対照的に,利用者が提案した代替品を優先することを示す定性的な人間分析を行った。
論文 参考訳(メタデータ) (2025-02-06T16:05:50Z) - Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - Breaking Down Word Semantics from Pre-trained Language Models through
Layer-wise Dimension Selection [0.0]
本稿では,レイヤ間の中間出力にバイナリマスクを適用することにより,BERTから意味感覚を分離することを目的とする。
2つの異なる文の目的語が同じ意味を持つかどうかを判定するために、二分分類により、アンタングル埋め込みを評価する。
論文 参考訳(メタデータ) (2023-10-08T11:07:19Z) - Unsupervised Semantic Variation Prediction using the Distribution of
Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。
意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。
対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文 参考訳(メタデータ) (2023-05-15T13:58:21Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Rectifying Pseudo Label Learning via Uncertainty Estimation for Domain
Adaptive Semantic Segmentation [49.295165476818866]
本稿では、意味的セグメンテーションの文脈において、ソースドメインからターゲットドメインへの知識伝達の教師なし領域適応に焦点を当てる。
既存のアプローチでは、通常、擬似ラベルを未ラベルのターゲットドメインデータを完全に活用するための基礎的真理とみなす。
本稿では,擬似ラベル学習の修正のために,学習中の予測の不確かさを明示的に推定することを提案する。
論文 参考訳(メタデータ) (2020-03-08T12:37:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。