論文の概要: Task-Oriented Paraphrase Analytics
- arxiv url: http://arxiv.org/abs/2403.17564v1
- Date: Tue, 26 Mar 2024 10:14:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 15:47:16.927295
- Title: Task-Oriented Paraphrase Analytics
- Title(参考訳): Task-Oriented Paraphrase Analytics
- Authors: Marcel Gohsen, Matthias Hagen, Martin Potthast, Benno Stein,
- Abstract要約: パラフレーズ化は未定義のタスクであるため、"paraphrasing"という用語は異なる特徴を持つテキスト変換タスクをカバーしている。
本稿では,25のパラフレージング(サブタスク)を組織化する分類法を提案する。
- 参考スコア(独自算出の注目度): 34.95500212742163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since paraphrasing is an ill-defined task, the term "paraphrasing" covers text transformation tasks with different characteristics. Consequently, existing paraphrasing studies have applied quite different (explicit and implicit) criteria as to when a pair of texts is to be considered a paraphrase, all of which amount to postulating a certain level of semantic or lexical similarity. In this paper, we conduct a literature review and propose a taxonomy to organize the 25~identified paraphrasing (sub-)tasks. Using classifiers trained to identify the tasks that a given paraphrasing instance fits, we find that the distributions of task-specific instances in the known paraphrase corpora vary substantially. This means that the use of these corpora, without the respective paraphrase conditions being clearly defined (which is the normal case), must lead to incomparable and misleading results.
- Abstract(参考訳): パラフレーズ化は未定義のタスクであるため、"paraphrasing"という用語は異なる特徴を持つテキスト変換タスクをカバーしている。
その結果、既存のパラフレーズ研究は、ある一対のテキストがパラフレーズと見なされる時期について、かなり異なる(明示的で暗黙的な)基準を適用し、その全ては特定の意味論や語彙的類似性を仮定している。
本稿では,25-identified paraphrasing (sub-)tasksを組織化するための文献レビューを行い,分類法を提案する。
与えられたパラフレーズインスタンスが適合するタスクを特定するために訓練された分類器を用いて、既知のパラフレーズコーパス内のタスク固有のインスタンスの分布が著しく異なることを発見した。
これは、これらのコーパスの使用は、それぞれのパラフレーズ条件が明確に定義されていない(通常の場合)ため、相容れない、誤った結果をもたらす必要があることを意味する。
関連論文リスト
- "Definition Modeling: To model definitions." Generating Definitions With
Little to No Semantics [0.4061135251278187]
我々は、このタスクが期待するほど意味論を含まないかもしれないという証拠を提示する。
文献から得られた先行モデルは、明示的なポリセミズムのような意味的側面にかなり敏感であることを示す。
論文 参考訳(メタデータ) (2023-06-14T11:08:38Z) - Unsupervised Semantic Variation Prediction using the Distribution of
Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。
意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。
対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文 参考訳(メタデータ) (2023-05-15T13:58:21Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Monolingual alignment of word senses and definitions in lexicographical
resources [0.0]
この論文の焦点は、辞書、特に辞書のアライメントである。
最初の課題は、2つの異なる単言語辞書における見出しの感覚定義を考慮し、最適なアライメントを見つけることである。
このベンチマークは、単語センスアライメントシステムの評価に使用することができる。
論文 参考訳(メタデータ) (2022-09-06T13:09:52Z) - Paraphrasing, textual entailment, and semantic similarity above word
level [2.411299055446423]
論文は、2つ以上の複雑な言語表現の間に保持できる意味関係の言語的側面と計算的側面を探求する。
特に、パラフレーズ、テクスト・エンターメント、コントラディクション、セマンティック・類似性に焦点を当てている。
論文 参考訳(メタデータ) (2022-08-10T15:07:49Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Improving Paraphrase Detection with the Adversarial Paraphrasing Task [0.0]
パラフレーズデータセットは現在、単語の重複と構文に基づくパラフレーズの感覚に依存している。
パラフレーズ識別のための新しいデータセット生成法: 逆パラフレーズ処理タスク(APT)について紹介する。
APTは参加者に意味論的に等価(相互に意味的)であるが、語彙的にも構文的にも異なるパラフレーズを生成するよう要求する。
論文 参考訳(メタデータ) (2021-06-14T18:15:20Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z) - CASE: Context-Aware Semantic Expansion [68.30244980290742]
本稿では,CASE(Context-Aware Semantic Expansion)と呼ばれる新しいタスクを定義し,検討する。
セマンティックな文脈でシード項が与えられた場合、その文脈に適した他の用語をシードとして提案することを目指している。
このタスクのアノテーションは,既存のコーパスから完全に自動で,大規模に抽出可能であることを示す。
論文 参考訳(メタデータ) (2019-12-31T06:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。