論文の概要: DIFFQG: Generating Questions to Summarize Factual Changes
- arxiv url: http://arxiv.org/abs/2303.00242v1
- Date: Wed, 1 Mar 2023 05:45:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-02 16:02:23.831625
- Title: DIFFQG: Generating Questions to Summarize Factual Changes
- Title(参考訳): diffqg: 事実の変化を要約する質問の生成
- Authors: Jeremy R. Cole, Palak Jain, Julian Martin Eisenschlos, Michael J.Q.
Zhang, Eunsol Choi, Bhuwan Dhingra
- Abstract要約: 本稿では,ペア化された文書間の事実変化を質問応答ペアとして表現する。
DIFFQGは、759のQAペアと1153のペアパスの実際の変更のない例で構成されている。
- 参考スコア(独自算出の注目度): 41.142542919449355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identifying the difference between two versions of the same article is useful
to update knowledge bases and to understand how articles evolve. Paired texts
occur naturally in diverse situations: reporters write similar news stories and
maintainers of authoritative websites must keep their information up to date.
We propose representing factual changes between paired documents as
question-answer pairs, where the answer to the same question differs between
two versions. We find that question-answer pairs can flexibly and concisely
capture the updated contents. Provided with paired documents, annotators
identify questions that are answered by one passage but answered differently or
cannot be answered by the other. We release DIFFQG which consists of 759 QA
pairs and 1153 examples of paired passages with no factual change. These
questions are intended to be both unambiguous and information-seeking and
involve complex edits, pushing beyond the capabilities of current question
generation and factual change detection systems. Our dataset summarizes the
changes between two versions of the document as questions and answers, studying
automatic update summarization in a novel way.
- Abstract(参考訳): 同じ記事の2つのバージョンの違いを特定することは、知識ベースを更新し、記事の進化を理解するのに役立つ。
記者は同様のニュース記事を書き、権威あるウェブサイトのメンテナは情報を最新状態に保つ必要がある。
本稿では,文書間の事実変化を質問対として表現し,同じ質問に対する回答が2つのバージョンで異なることを示す。
質問応答対は柔軟かつ簡潔に更新内容をキャプチャできることがわかった。
ペアの文書が与えられた場合、注釈家は1つの文で答えられるが別の文で答えられていない質問を識別する。
759対のQAペアと1153対のペアパスの実際の変化のない例からなるDIFFQGをリリースする。
これらの質問は曖昧さと情報検索の両方を意図しており、現在の質問生成と事実変化検出システムの能力を超えて複雑な編集を行う。
本データセットは、文書の2つのバージョン間の変更を質問と回答として要約し、新しい方法で自動更新要約を研究する。
関連論文リスト
- Evidence Contextualization and Counterfactual Attribution for Conversational QA over Heterogeneous Data with RAG Systems [4.143039012104666]
Retrieval Augmented Generation(RAG)は、会話質問回答(ConvQA)を介して企業のデータと対話するためのバックボーンとして機能する。
本研究では,RAGONITE(RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE ,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGO NITE)について述べる。
論文 参考訳(メタデータ) (2024-12-13T21:28:17Z) - Answering Ambiguous Questions with a Database of Questions, Answers, and
Revisions [95.92276099234344]
ウィキペディアから生成される曖昧な質問のデータベースを利用して、あいまいな質問に答えるための新しい最先端技術を提案する。
提案手法は,リコール対策で15%,予測出力から不明瞭な質問を評価する尺度で10%向上する。
論文 参考訳(メタデータ) (2023-08-16T20:23:16Z) - Discord Questions: A Computational Approach To Diversity Analysis in
News Coverage [84.55145223950427]
本稿では,情報源の違いを識別し,ニュース報道の多様性を理解する上で,読者を支援する新しい枠組みを提案する。
このフレームワークはDiscord Questionsの生成に基づいている。
論文 参考訳(メタデータ) (2022-11-09T16:37:55Z) - Discourse Analysis via Questions and Answers: Parsing Dependency
Structures of Questions Under Discussion [57.43781399856913]
この研究は、談話分析にQUD(Language framework of Questions Under discussion)を採用する。
我々は、文間の関係を、徹底的なきめ細かい質問とは対照的に、自由形式の質問として特徴づける。
完全文書上の質問の依存関係構造を導出する第一種QUDを開発する。
論文 参考訳(メタデータ) (2022-10-12T03:53:12Z) - Investigating Information Inconsistency in Multilingual Open-Domain
Question Answering [18.23417521199809]
検索バイアスに着目した多言語開領域質問応答モデルの振る舞いを解析する。
言語間での文書の内容の違いは、文化的な相違や社会的偏見を反映しているのではないかと推測する。
論文 参考訳(メタデータ) (2022-05-25T02:58:54Z) - Discourse Comprehension: A Question Answering Framework to Represent
Sentence Connections [35.005593397252746]
談話理解のためのモデルの構築と評価における重要な課題は、注釈付きデータの欠如である。
本稿では,ニュース文書の理解を目的としたスケーラブルなデータ収集を実現する新しいパラダイムを提案する。
得られたコーパスDCQAは、607の英語文書からなる22,430の質問応答ペアで構成されている。
論文 参考訳(メタデータ) (2021-11-01T04:50:26Z) - Challenges in Information-Seeking QA: Unanswerable Questions and
Paragraph Retrieval [46.3246135936476]
情報検索クエリの応答がより難しい理由と,その原因を解析する。
制御実験の結果,2つのヘッドルーム – 段落選択と応答可能性予測 – が示唆された。
私たちは6つの言語で800の未解決例を手動で注釈付けします。
論文 参考訳(メタデータ) (2020-10-22T17:48:17Z) - Inquisitive Question Generation for High Level Text Comprehension [60.21497846332531]
InQUISITIVEは、文書を読みながら19K質問を抽出するデータセットである。
我々は,読者が情報を求めるための実践的な戦略に携わることを示す。
我々は, GPT-2に基づく質問生成モデルを評価し, 妥当な質問を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-04T19:03:39Z) - Match$^2$: A Matching over Matching Model for Similar Question
Identification [74.7142127303489]
コミュニティ質問回答(Community Question Answering, CQA)は,質問や回答の提出を自由に行う,知識獲得のための主要な手段となっている。
類似した質問識別は、CQAの中核的なタスクとなり、新しい質問が尋ねられるたびに、アーカイブされたリポジトリから同様の質問を見つけることを目的としている。
自然言語の固有のバリエーション、すなわち、同じ質問をしたり、同じ表現を共有する異なる質問をする方法があるため、この2つの質問の類似性を適切に測定することは、長い間困難であった。
従来の手法では片側の使用が一般的であり、答えを拡張された表現として活用する。
論文 参考訳(メタデータ) (2020-06-21T05:59:34Z) - Guided Transformer: Leveraging Multiple External Sources for
Representation Learning in Conversational Search [36.64582291809485]
あいまいなクエリやフェースドクエリに対する質問を明確にすることは,様々な情報検索システムにおいて有用な手法として認識されている。
本稿では,トランスフォーマーネットワークが学習した表現を,外部情報ソースからの新たなアテンション機構を用いて強化する。
実験では,検索の明確化のための公開データセットを用いて,競合するベースラインと比較して大きな改善点を示した。
論文 参考訳(メタデータ) (2020-06-13T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。