論文の概要: QA-Align: Representing Cross-Text Content Overlap by Aligning
Question-Answer Propositions
- arxiv url: http://arxiv.org/abs/2109.12655v1
- Date: Sun, 26 Sep 2021 17:19:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:36:15.295466
- Title: QA-Align: Representing Cross-Text Content Overlap by Aligning
Question-Answer Propositions
- Title(参考訳): QA-Align: 質問応答によるクロステキストコンテンツオーバーラップの表現
- Authors: Daniela Brook Weiss, Paul Roit, Ayal Klein, Ori Ernst, Ido Dagan
- Abstract要約: 本稿では,情報統合のための足場として,テキスト間の述語関係の整合性を提案する。
我々の設定はQA-SRLを利用して、質問応答ペアを用いて述語-論証関係をキャプチャする。
分析によると、私たちの新しいタスクはセマンティックに困難であり、語彙的類似性を超えてコンテンツの重複を捉えている。
- 参考スコア(独自算出の注目度): 12.264795812337153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-text applications, such as multi-document summarization, are typically
required to model redundancies across related texts. Current methods
confronting consolidation struggle to fuse overlapping information. In order to
explicitly represent content overlap, we propose to align predicate-argument
relations across texts, providing a potential scaffold for information
consolidation. We go beyond clustering coreferring mentions, and instead model
overlap with respect to redundancy at a propositional level, rather than merely
detecting shared referents. Our setting exploits QA-SRL, utilizing
question-answer pairs to capture predicate-argument relations, facilitating
laymen annotation of cross-text alignments. We employ crowd-workers for
constructing a dataset of QA-based alignments, and present a baseline QA
alignment model trained over our dataset. Analyses show that our new task is
semantically challenging, capturing content overlap beyond lexical similarity
and complements cross-document coreference with proposition-level links,
offering potential use for downstream tasks.
- Abstract(参考訳): マルチドキュメント要約のようなマルチテキストアプリケーションは、通常、関連するテキスト間の冗長性をモデル化するために必要となる。
重なり合う情報を融合する統合に直面する現状の手法
コンテンツ重複を明示的に表現するために,テキスト間の述語関係の整合化を提案し,情報統合のための足場を提供する。
私たちは、言及を推論するクラスタリングを超えて、単に共有の参照子を検出するのではなく、命題レベルで冗長性に関して重複をモデル化します。
我々の設定はQA-SRLを利用して、質問と回答のペアを使って述語と議論の関係を捉える。
クラウドワーカーを用いてQAベースのアライメントのデータセットを構築し、データセット上でトレーニングされたベースラインQAアライメントモデルを示す。
分析の結果、新しいタスクは意味的に困難であり、語彙的類似性を超えてコンテンツの重複を捉え、命題レベルのリンクとドキュメント間のコリファレンスを補完し、下流タスクの潜在的な利用を提供する。
関連論文リスト
- Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。
そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - Leveraging Inter-Chunk Interactions for Enhanced Retrieval in Large Language Model-Based Question Answering [12.60063463163226]
IIERは、構造、キーワード、セマンティックという3つのタイプの相互作用を考慮し、ドキュメントチャンク間の内部接続をキャプチャする。
対象の質問に基づいて複数のシードノードを特定し、関連するチャンクを反復的に検索して、支持する証拠を収集する。
コンテキストと推論チェーンを洗練し、推論と回答の生成において大きな言語モデルを支援する。
論文 参考訳(メタデータ) (2024-08-06T02:39:55Z) - The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - Revisiting Sentence Union Generation as a Testbed for Text Consolidation [17.594941316215838]
本稿では,テキスト統合能力を評価するために,文結合生成タスクを効果的に適切に定義されたテストベッドとして再考する。
我々は,文連合をクラウドソーシングし,これまでで最大の連合データセットを作成するための,洗練されたアノテーション方法論とツールを提案する。
次に、人間と自動両方の評価を含む、連合生成のための包括的評価プロトコルを提案する。
論文 参考訳(メタデータ) (2023-05-24T22:34:01Z) - Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.85790367128085]
我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文 参考訳(メタデータ) (2023-05-24T17:48:40Z) - QASem Parsing: Text-to-text Modeling of QA-based Semantics [19.42681342441062]
本稿では,QA-SRL,QANom,QADiscourseの3つの意味的タスクについて考察する。
最初に統合されたQASem解析ツールをリリースし、下流アプリケーションに実用的です。
論文 参考訳(メタデータ) (2022-05-23T15:56:07Z) - Extending Multi-Text Sentence Fusion Resources via Pyramid Annotations [12.394777121890925]
本稿では、過去のデータセット作成の取り組みを再考し、大幅に拡張する。
拡張版では、複数のドキュメントタスクにもっと代表的なテキストを使用し、より大きく、より多様なトレーニングセットを提供しています。
論文 参考訳(メタデータ) (2021-10-09T09:15:05Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Pairwise Representation Learning for Event Coreference [73.10563168692667]
イベント参照ペアのためのペアワイズ表現学習(Pairwise Representation Learning, PairwiseRL)手法を開発した。
私たちの表現は、イベントとその引数のエンコーディングを容易にするために、テキストスニペットのより微細で構造化された表現をサポートします。
PairwiseRLは、その単純さにもかかわらず、クロスドキュメントとイントラドキュメントのイベントコアベンチマークベンチマークの両方において、従来の最先端のイベントコアシステムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T06:55:52Z) - Query Focused Multi-Document Summarization with Distant Supervision [88.39032981994535]
既存の作業は、クエリとテキストセグメント間の関連性を推定する検索スタイルの手法に大きく依存している。
本稿では,クエリに関連するセグメントを推定するための個別モジュールを導入した粗大なモデリングフレームワークを提案する。
我々のフレームワークは、標準QFSベンチマークにおいて、強力な比較システムよりも優れていることを実証する。
論文 参考訳(メタデータ) (2020-04-06T22:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。