論文の概要: Text Simplification for Comprehension-based Question-Answering
- arxiv url: http://arxiv.org/abs/2109.13984v1
- Date: Tue, 28 Sep 2021 18:48:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 06:30:20.511696
- Title: Text Simplification for Comprehension-based Question-Answering
- Title(参考訳): 包括的質問応答のためのテキスト簡易化
- Authors: Tanvi Dadu, Kartikey Pant, Seema Nagar, Ferdous Ahmed Barbhuiya,
Kuntal Dey
- Abstract要約: 広く使われているSQuADデータセットの簡易バージョンであるSimple-SQuADをリリースする。
新たに作成したコーパスをベンチマークし,SQuADに基づく質問応答課題における単純化プロセスの効果を検討するためのアブレーション研究を行った。
- 参考スコア(独自算出の注目度): 7.144235435987265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text simplification is the process of splitting and rephrasing a sentence to
a sequence of sentences making it easier to read and understand while
preserving the content and approximating the original meaning. Text
simplification has been exploited in NLP applications like machine translation,
summarization, semantic role labeling, and information extraction, opening a
broad avenue for its exploitation in comprehension-based question-answering
downstream tasks. In this work, we investigate the effect of text
simplification in the task of question-answering using a comprehension context.
We release Simple-SQuAD, a simplified version of the widely-used SQuAD dataset.
Firstly, we outline each step in the dataset creation pipeline, including
style transfer, thresholding of sentences showing correct transfer, and offset
finding for each answer. Secondly, we verify the quality of the transferred
sentences through various methodologies involving both automated and human
evaluation. Thirdly, we benchmark the newly created corpus and perform an
ablation study for examining the effect of the simplification process in the
SQuAD-based question answering task. Our experiments show that simplification
leads to up to 2.04% and 1.74% increase in Exact Match and F1, respectively.
Finally, we conclude with an analysis of the transfer process, investigating
the types of edits made by the model, and the effect of sentence length on the
transfer model.
- Abstract(参考訳): テキスト簡易化(text simplification)とは、文章を文章の列に分割し、読みやすくし、内容を保持し、元の意味を近似するプロセスである。
テキストの単純化は、機械翻訳、要約、セマンティックロールラベリング、情報抽出といったNLPアプリケーションで活用され、理解に基づく質問応答タスクにおけるその活用の幅広い道を開いた。
本研究では,理解コンテキストを用いた質問応答作業におけるテキスト簡易化の効果について検討する。
広く使われているSQuADデータセットの簡易バージョンであるSimple-SQuADをリリースする。
まず,データセット作成パイプラインの各ステップを概説し,各回答に対するスタイル転送,正しい転送を示す文のしきい値化,オフセット検索などについて概説する。
第二に, 自動評価と人間評価の両方を含む様々な手法を用いて, 伝達文の品質を検証する。
第3に,新たに作成したコーパスをベンチマークし,スプリットベース質問応答タスクにおける単純化過程の効果を検討するため,アブレーション研究を行う。
実験の結果, 単純化は, Exact MatchとF1の最大24%, 1.74%の増加につながることがわかった。
最後に、転送プロセスの解析を行い、モデルによる編集のタイプと、転送モデルに対する文長の影響について検討する。
関連論文リスト
- Elaborative Simplification as Implicit Questions Under Discussion [51.17933943734872]
本稿では,QUD フレームワークのレンズによる共同作業の簡略化について考察する。
本研究は,QUDを明示的にモデル化することで,作業の単純化と,作業内容と作業内容の関連性について,重要な理解が得られていることを示す。
論文 参考訳(メタデータ) (2023-05-17T17:26:16Z) - Syntactic Complexity Identification, Measurement, and Reduction Through
Controlled Syntactic Simplification [0.0]
本稿では,複合文と複合文を簡易文の集合に分割・言い換える,古典的な構文的依存性に基づく手法を提案する。
また,文の構文的複雑さを同定し,測定するアルゴリズムも導入した。
この研究は、WSDM-2023 Conferenceにおいて、Learning with Knowledge Graphs (IWLKG) に関する国際ワークショップで受け入れられ、発表された。
論文 参考訳(メタデータ) (2023-04-16T13:13:58Z) - Exploiting Summarization Data to Help Text Simplification [50.0624778757462]
テキスト要約とテキスト単純化の類似性を解析し,要約データを利用して単純化を行った。
我々はこれらのペアをSum4Simp (S4S) と命名し,S4Sが高品質であることを示す人間評価を行った。
論文 参考訳(メタデータ) (2023-02-14T15:32:04Z) - NapSS: Paragraph-level Medical Text Simplification via Narrative
Prompting and Sentence-matching Summarization [46.772517928718216]
そこで我々はNapSSと呼ばれる2段階戦略を提案する。
NapSSは、オリジナルの物語の流れが保存されていることを保証しながら、関連コンテンツを特定し、単純化する。
本モデルは,英語医療コーパスのSeq2seqベースラインよりも有意に優れている。
論文 参考訳(メタデータ) (2023-02-11T02:20:25Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - Document-Level Text Simplification: Dataset, Criteria and Baseline [75.58761130635824]
文書レベルのテキスト単純化の新しいタスクを定義し,検討する。
Wikipediaダンプに基づいて、我々はまずD-Wikipediaという大規模なデータセットを構築した。
本稿では,文書レベルの単純化作業に適したD-SARIと呼ばれる新しい自動評価指標を提案する。
論文 参考訳(メタデータ) (2021-10-11T08:15:31Z) - Elaborative Simplification: Content Addition and Explanation Generation
in Text Simplification [33.08519864889526]
テキスト単純化におけるコンテンツ追加に関する最初のデータ駆動型研究について述べる。
我々は、文脈的特異性のレンズを通して、エンティティ、アイデア、概念がどのように精巧化されているかを分析する。
本研究は, 作業の複雑さを概説し, 今後の課題について多くの興味深い方向性を示唆するものである。
論文 参考訳(メタデータ) (2020-10-20T05:06:23Z) - Explainable Prediction of Text Complexity: The Missing Preliminaries for
Text Simplification [13.447565774887215]
テキストの単純化により、アクセシビリティーのためにプロのコンテンツが複雑になる。
入力テキストの簡易版を直接生成するために、エンドツーエンドのニューラルネットワークモデルが広く採用されている。
テキストの単純化をタスクのコンパクトなパイプラインに分解することで、プロセスの透明性と説明可能性を確保することができることを示す。
論文 参考訳(メタデータ) (2020-07-31T03:33:37Z) - ASSET: A Dataset for Tuning and Evaluation of Sentence Simplification
Models with Multiple Rewriting Transformations [97.27005783856285]
本稿では,英語で文の単純化を評価するための新しいデータセットであるASSETを紹介する。
ASSETの単純化は、タスクの他の標準評価データセットと比較して、単純さの特徴を捉えるのに優れていることを示す。
論文 参考訳(メタデータ) (2020-05-01T16:44:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。