論文の概要: U3E: Unsupervised and Erasure-based Evidence Extraction for Machine
Reading Comprehension
- arxiv url: http://arxiv.org/abs/2210.02621v1
- Date: Thu, 6 Oct 2022 00:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 16:18:00.540001
- Title: U3E: Unsupervised and Erasure-based Evidence Extraction for Machine
Reading Comprehension
- Title(参考訳): u3e: 機械読解のための教師なしおよび消去に基づく証拠抽出
- Authors: Suzhe He, Shumin Shi and Chenghao Wu
- Abstract要約: 本稿では,教師なし証拠抽出法(U3E)を提案する。
U3Eは文書中の文レベルの特徴消去後の変化を入力として、人間の記憶低下に起因する問題解決能力の低下をシミュレートする。
実験の結果、U3Eは単純だが有効であり、証拠をより正確に抽出するだけでなく、モデルの性能も大幅に向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: More tasks in Machine Reading Comprehension(MRC) require, in addition to
answer prediction, the extraction of evidence sentences that support the
answer. However, the annotation of supporting evidence sentences is usually
time-consuming and labor-intensive. In this paper, to address this issue and
considering that most of the existing extraction methods are semi-supervised,
we propose an unsupervised evidence extraction method (U3E). U3E takes the
changes after sentence-level feature erasure in the document as input,
simulating the decline in problem-solving ability caused by human memory
decline. In order to make selections on the basis of fully understanding the
semantics of the original text, we also propose metrics to quickly select the
optimal memory model for this input changes. To compare U3E with typical
evidence extraction methods and investigate its effectiveness in evidence
extraction, we conduct experiments on different datasets. Experimental results
show that U3E is simple but effective, not only extracting evidence more
accurately, but also significantly improving model performance.
- Abstract(参考訳): 機械読解理解(MRC)におけるより多くのタスクは、解答の予測に加えて、解答を支持する証拠文の抽出を必要とする。
しかし、証拠文を支持するアノテーションは通常、時間と労力がかかる。
本稿では,この問題に対処し,既存の抽出手法の大部分が半監督されていることを考慮し,教師なし証拠抽出法(U3E)を提案する。
U3Eは文書中の文レベルの特徴消去後の変化を入力として、人間の記憶低下に起因する問題解決能力の低下をシミュレートする。
原文のセマンティクスを十分に理解した上で選択を行うために,この入力変化に対して最適なメモリモデルを迅速に選択するためのメトリクスを提案する。
U3Eと典型的なエビデンス抽出法を比較し,そのエビデンス抽出における有効性を検討するため,異なるデータセットで実験を行った。
実験の結果、U3Eは単純だが有効であり、証拠をより正確に抽出するだけでなく、モデルの性能も大幅に向上した。
関連論文リスト
- SEER: Self-Aligned Evidence Extraction for Retrieval-Augmented Generation [21.823931225182115]
本稿では,バニラモデルをエビデンス抽出器として最適化するためのモデルに基づくエビデンス抽出学習フレームワークSEERを提案する。
提案手法は, 最終RAG性能を大幅に向上させ, 抽出した証拠の忠実度, 有用性, 簡潔性を向上し, 証拠の長さを9.25倍に短縮する。
論文 参考訳(メタデータ) (2024-10-15T06:26:24Z) - Elastic Weight Removal for Faithful and Abstractive Dialogue Generation [61.40951756070646]
対話システムは、関連する文書に含まれる知識に忠実な応答を生成するべきである。
多くのモデルは、それと矛盾したり、検証不可能な情報を含んでいる代わりに幻覚応答を生成する。
本手法は,幻覚と抽出反応を同時に阻止するために拡張できることが示唆された。
論文 参考訳(メタデータ) (2023-03-30T17:40:30Z) - Improving Multi-Document Summarization through Referenced Flexible
Extraction with Credit-Awareness [21.037841262371355]
MDS(Multi-Document Summarization)における注目すべき課題は、入力の非常に長い長さである。
本稿では,この問題を克服するための抽出・抽出・吸収変換器フレームワークを提案する。
擬似抽出オラクルにない文の不等式の重要性をモデルに認識させる損失重み付け機構を提案する。
論文 参考訳(メタデータ) (2022-05-04T04:40:39Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Abstract, Rationale, Stance: A Joint Model for Scientific Claim
Verification [18.330265729989843]
我々は,3つのタスクのモジュールを,機械読解フレームワークを用いて共同で学習するアプローチをARSJointとして提案する。
ベンチマークデータセットSciFactの実験結果は、我々のアプローチが既存の作業より優れていることを示している。
論文 参考訳(メタデータ) (2021-09-13T10:07:26Z) - Weakly- and Semi-supervised Evidence Extraction [107.47661281843232]
本稿では,エビデンス抽出の課題に対して,いくつかのエビデンスアノテーションと豊富な文書レベルラベルを組み合わせた新たな手法を提案する。
私たちのアプローチは、数百のエビデンスアノテーションでかなりの利益をもたらします。
論文 参考訳(メタデータ) (2020-11-03T04:05:00Z) - A Self-Training Method for Machine Reading Comprehension with Soft
Evidence Extraction [89.88061141170512]
機械読解モデルの学習のための自己学習法(STM)を提案する。
各イテレーションにおいて、ベースMCCモデルは、黄金の回答とノイズの多いエビデンスラベルで訓練される。
トレーニングされたモデルは、偽の証拠ラベルを次のイテレーションで追加の監督として予測する。
論文 参考訳(メタデータ) (2020-05-11T15:26:07Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。