論文の概要: A Novel Metric for Evaluating Semantics Preservation
- arxiv url: http://arxiv.org/abs/2110.01176v1
- Date: Mon, 4 Oct 2021 03:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-05 15:37:54.274355
- Title: A Novel Metric for Evaluating Semantics Preservation
- Title(参考訳): セマンティクスの保存性評価のための新しい指標
- Authors: Letian Peng, Zuchao Li and Hai Zhao
- Abstract要約: 我々は、事前学習言語モデル(PLM)を活用し、文の編集過程のセマンティクス保存を評価する。
我々の測定値であるNDD(Neighbor Distribution Divergence)は、隣接する単語の予測分布の乱れを評価する。
NDDはテキストの類似性によって容易に無視されるセマンティクスの正確な変化を検出することができる。
- 参考スコア(独自算出の注目度): 48.69930912510414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we leverage pre-trained language models (PLMs) to precisely
evaluate the semantics preservation of edition process on sentences. Our
metric, Neighbor Distribution Divergence (NDD), evaluates the disturbance on
predicted distribution of neighboring words from mask language model (MLM). NDD
is capable of detecting precise changes in semantics which are easily ignored
by text similarity. By exploiting the property of NDD, we implement a
unsupervised and even training-free algorithm for extractive sentence
compression. We show that our NDD-based algorithm outperforms previous
perplexity-based unsupervised algorithm by a large margin. For further
exploration on interpretability, we evaluate NDD by pruning on syntactic
dependency treebanks and apply NDD for predicate detection as well.
- Abstract(参考訳): 本稿では,事前学習言語モデル(PLM)を活用し,文の編集過程のセマンティックス保存を正確に評価する。
筆者らの指標であるNDD(Neighbor Distribution Divergence)は,マスク言語モデル(MLM)による近隣語分布予測の障害を評価する。
NDDはテキスト類似性によって容易に無視される意味論の正確な変化を検出することができる。
NDDの特性を生かして,抽出文圧縮のための教師なしおよびトレーニング不要なアルゴリズムを実装した。
nddに基づくアルゴリズムは,従来のパープレキシティに基づく非教師なしアルゴリズムを大きなマージンで上回っている。
解釈可能性に関するさらなる検討のために,構文依存ツリーバンクをプルーニングすることでNDDを評価し,述語検出にもNDDを適用した。
関連論文リスト
- Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - Spatial Semantic Recurrent Mining for Referring Image Segmentation [63.34997546393106]
高品質なクロスモーダリティ融合を実現するために,Stextsuperscript2RMを提案する。
これは、言語特徴の分散、空間的意味的再帰的分離、パーセマンティック・セマンティック・バランシングという三部作の作業戦略に従う。
提案手法は他の最先端アルゴリズムに対して好適に機能する。
論文 参考訳(メタデータ) (2024-05-15T00:17:48Z) - Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。
タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。
我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文 参考訳(メタデータ) (2024-02-13T02:46:45Z) - Topic-DPR: Topic-based Prompts for Dense Passage Retrieval [6.265789210037749]
トピックベースのプロンプトを用いた高密度経路探索モデルであるTopic-DPRを提案する。
本稿では, 半構造化データを利用して高密度検索効率を向上させる, 新規な正負サンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-10-10T13:45:24Z) - Retrofitting Multilingual Sentence Embeddings with Abstract Meaning
Representation [70.58243648754507]
抽象的意味表現(AMR)を用いた既存の多言語文の埋め込みを改善する新しい手法を提案する。
原文入力と比較すると、AMRは文の中核概念と関係を明確かつ曖昧に表す構造的意味表現である。
実験結果から,多言語文をAMRで埋め込むと,意味的類似性と伝達タスクの両方において,最先端の性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-10-18T11:37:36Z) - Lexical semantics enhanced neural word embeddings [4.040491121427623]
階層的適合は、IS-A階層に本質的に格納されている意味的類似性ニュアンスをモデル化するための新しいアプローチである。
その結果、後期核融合における意味的関係を持つ神経埋め込みを専門とする階層化の有効性が示された。
論文 参考訳(メタデータ) (2022-10-03T08:10:23Z) - Unsupervised Mismatch Localization in Cross-Modal Sequential Data [5.932046800902776]
我々は、コンテンツミスマッチしたクロスモーダルデータ間の関係を推測できる教師なし学習アルゴリズムを開発した。
本稿では,音声生成過程を階層的に構造化された潜在変数に分解する,ミスマッチ局所化変分自動符号化(ML-VAE)という階層型ベイズディープラーニングモデルを提案する。
実験の結果,ML-VAEは人間のアノテーションを必要とせず,テキストと音声のミスマッチの特定に成功した。
論文 参考訳(メタデータ) (2022-05-05T14:23:27Z) - Perturbing Inputs for Fragile Interpretations in Deep Natural Language
Processing [18.91129968022831]
解釈可能性の手法は、医療や金融などの高い分野における信頼できるNLPアプリケーションにとって堅牢である必要がある。
本稿では,入力テキスト上で単純な単語摂動を行うことで,解釈がどのように操作できるかを示す。
論文 参考訳(メタデータ) (2021-08-11T02:07:21Z) - EDS-MEMBED: Multi-sense embeddings based on enhanced distributional
semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。
M-SEの新たな分布意味類似度測定法を先行して導出する。
WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文 参考訳(メタデータ) (2021-02-27T14:36:55Z) - Towards Accurate Scene Text Recognition with Semantic Reasoning Networks [52.86058031919856]
本稿では,シーンテキスト認識のための意味推論ネットワーク(SRN)という,エンドツーエンドのトレーニング可能な新しいフレームワークを提案する。
GSRMはマルチウェイ並列伝送によってグローバルセマンティックコンテキストをキャプチャするために導入された。
正規テキスト,不規則テキスト,非ラテン語長文を含む7つの公開ベンチマークの結果,提案手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2020-03-27T09:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。