論文の概要: R$^2$F: A General Retrieval, Reading and Fusion Framework for
Document-level Natural Language Inference
- arxiv url: http://arxiv.org/abs/2210.12328v1
- Date: Sat, 22 Oct 2022 02:02:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 15:50:19.358418
- Title: R$^2$F: A General Retrieval, Reading and Fusion Framework for
Document-level Natural Language Inference
- Title(参考訳): R$^2$F:ドキュメントレベルの自然言語推論のための一般検索・読解・統合フレームワーク
- Authors: Hao Wang, Yixin Cao, Yangguang Li, Zhen Huang, Kun Wang, Jing Shao
- Abstract要約: 文書レベルの自然言語推論(DOCNLI)は、自然言語処理における新しい課題である。
我々は、Retrieval, Reading and Fusion (R2F)フレームワークと呼ばれる一般的なソリューションと、新しい設定を確立する。
実験結果から,R2Fフレームワークは最先端の性能を得ることができ,多種多様なエビデンス検索手法に対して堅牢であることがわかった。
- 参考スコア(独自算出の注目度): 29.520857954199904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Document-level natural language inference (DOCNLI) is a new challenging task
in natural language processing, aiming at judging the entailment relationship
between a pair of hypothesis and premise documents. Current datasets and
baselines largely follow sentence-level settings, but fail to address the
issues raised by longer documents. In this paper, we establish a general
solution, named Retrieval, Reading and Fusion (R2F) framework, and a new
setting, by analyzing the main challenges of DOCNLI: interpretability,
long-range dependency, and cross-sentence inference. The basic idea of the
framework is to simplify document-level task into a set of sentence-level
tasks, and improve both performance and interpretability with the power of
evidence. For each hypothesis sentence, the framework retrieves evidence
sentences from the premise, and reads to estimate its credibility. Then the
sentence-level results are fused to judge the relationship between the
documents. For the setting, we contribute complementary evidence and entailment
label annotation on hypothesis sentences, for interpretability study. Our
experimental results show that R2F framework can obtain state-of-the-art
performance and is robust for diverse evidence retrieval methods. Moreover, it
can give more interpretable prediction results. Our model and code are released
at https://github.com/phoenixsecularbird/R2F.
- Abstract(参考訳): 文書レベルの自然言語推論(DOCNLI)は,仮説と前提文書の関連性を評価することを目的とした,自然言語処理における新たな課題である。
現在のデータセットとベースラインは、主に文レベルの設定に従うが、長いドキュメントによって提起された問題に対処できない。
本稿では,解釈可能性,長距離依存性,クロスセンス推論といったDOCNLIの主な課題を解析することにより,Retrieval,Reading and Fusion (R2F) フレームワークと新たなセッティングを構築する。
このフレームワークの基本的な考え方は、文書レベルのタスクを文レベルのタスクのセットに単純化し、証拠の力でパフォーマンスと解釈性を改善することである。
各仮説文について、このフレームワークは前提から証拠文を検索し、その信頼性を推定する。
そして、文レベルの結果を融合して文書間の関係を判断する。
本研究は,仮説文の補完的エビデンスと包括的ラベルアノテーションを解釈可能性研究に貢献する。
実験結果から,R2Fフレームワークは最先端の性能を得ることができ,多様なエビデンス検索手法に対して堅牢であることがわかった。
さらに、より解釈可能な予測結果が得られる。
私たちのモデルとコードはhttps://github.com/phoenixsecularbird/r2fでリリースしています。
関連論文リスト
- Fine-Grained Natural Language Inference Based Faithfulness Evaluation
for Diverse Summarisation Tasks [14.319567507959759]
既成の自然言語推論(NLI)モデルを用いた要約忠実度の評価手法について検討した。
InFusEという新しい手法を提案する。これは、変数の前提サイズを使い、要約文を短い仮説に単純化する。
論文 参考訳(メタデータ) (2024-02-27T15:57:11Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Document-Level Relation Extraction with Sentences Importance Estimation
and Focusing [52.069206266557266]
文書レベルの関係抽出(DocRE)は、複数の文の文書から2つのエンティティ間の関係を決定することを目的としている。
我々はDocREのための文重要度スコアと文集中損失を設計するSIEF(Sentence Estimation and Focusing)フレームワークを提案する。
2つのドメインの実験結果から、SIEFは全体的なパフォーマンスを改善するだけでなく、DocREモデルをより堅牢にします。
論文 参考訳(メタデータ) (2022-04-27T03:20:07Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - Eider: Evidence-enhanced Document-level Relation Extraction [56.71004595444816]
文書レベルの関係抽出(DocRE)は、文書内のエンティティペア間の意味関係を抽出することを目的としている。
本稿では,共同関係と証拠抽出,エビデンス中心関係抽出(RE),抽出結果の融合からなる3段階のエビデンス強化DocREフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-16T09:43:16Z) - LESA: Linguistic Encapsulation and Semantic Amalgamation Based
Generalised Claim Detection from Online Content [15.814664354258184]
LESAは、ソース非依存の一般化モデルを組み込むことで、先進的な問題を解消することを目的としている。
我々は、大規模な非構造化データセット上でテスト基盤を提供することを目的としたTwitterデータセットに注釈を付けることで、後者の問題を解決する。
実験の結果、LESAは6つのベンチマーククレームデータセットで最先端のパフォーマンスを改善することがわかった。
論文 参考訳(メタデータ) (2021-01-28T09:51:30Z) - L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。
新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。
ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文 参考訳(メタデータ) (2020-05-22T15:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。