論文の概要: QA-Align: Representing Cross-Text Content Overlap by Aligning
Question-Answer Propositions
- arxiv url: http://arxiv.org/abs/2109.12655v1
- Date: Sun, 26 Sep 2021 17:19:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:36:15.295466
- Title: QA-Align: Representing Cross-Text Content Overlap by Aligning
Question-Answer Propositions
- Title(参考訳): QA-Align: 質問応答によるクロステキストコンテンツオーバーラップの表現
- Authors: Daniela Brook Weiss, Paul Roit, Ayal Klein, Ori Ernst, Ido Dagan
- Abstract要約: 本稿では,情報統合のための足場として,テキスト間の述語関係の整合性を提案する。
我々の設定はQA-SRLを利用して、質問応答ペアを用いて述語-論証関係をキャプチャする。
分析によると、私たちの新しいタスクはセマンティックに困難であり、語彙的類似性を超えてコンテンツの重複を捉えている。
- 参考スコア(独自算出の注目度): 12.264795812337153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-text applications, such as multi-document summarization, are typically
required to model redundancies across related texts. Current methods
confronting consolidation struggle to fuse overlapping information. In order to
explicitly represent content overlap, we propose to align predicate-argument
relations across texts, providing a potential scaffold for information
consolidation. We go beyond clustering coreferring mentions, and instead model
overlap with respect to redundancy at a propositional level, rather than merely
detecting shared referents. Our setting exploits QA-SRL, utilizing
question-answer pairs to capture predicate-argument relations, facilitating
laymen annotation of cross-text alignments. We employ crowd-workers for
constructing a dataset of QA-based alignments, and present a baseline QA
alignment model trained over our dataset. Analyses show that our new task is
semantically challenging, capturing content overlap beyond lexical similarity
and complements cross-document coreference with proposition-level links,
offering potential use for downstream tasks.
- Abstract(参考訳): マルチドキュメント要約のようなマルチテキストアプリケーションは、通常、関連するテキスト間の冗長性をモデル化するために必要となる。
重なり合う情報を融合する統合に直面する現状の手法
コンテンツ重複を明示的に表現するために,テキスト間の述語関係の整合化を提案し,情報統合のための足場を提供する。
私たちは、言及を推論するクラスタリングを超えて、単に共有の参照子を検出するのではなく、命題レベルで冗長性に関して重複をモデル化します。
我々の設定はQA-SRLを利用して、質問と回答のペアを使って述語と議論の関係を捉える。
クラウドワーカーを用いてQAベースのアライメントのデータセットを構築し、データセット上でトレーニングされたベースラインQAアライメントモデルを示す。
分析の結果、新しいタスクは意味的に困難であり、語彙的類似性を超えてコンテンツの重複を捉え、命題レベルのリンクとドキュメント間のコリファレンスを補完し、下流タスクの潜在的な利用を提供する。
関連論文リスト
- Revisiting Sentence Union Generation as a Testbed for Text Consolidation [17.594941316215838]
本稿では,テキスト統合能力を評価するために,文結合生成タスクを効果的に適切に定義されたテストベッドとして再考する。
我々は,文連合をクラウドソーシングし,これまでで最大の連合データセットを作成するための,洗練されたアノテーション方法論とツールを提案する。
次に、人間と自動両方の評価を含む、連合生成のための包括的評価プロトコルを提案する。
論文 参考訳(メタデータ) (2023-05-24T22:34:01Z) - Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.85790367128085]
我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文 参考訳(メタデータ) (2023-05-24T17:48:40Z) - PAXQA: Generating Cross-lingual Question Answering Examples at Training
Scale [53.92008514395125]
PAXQA(クロスリンガル(x)QAのアノテーションの計画)は、クロスリンガルQAを2段階に分解する。
本稿では、並列ビットから制約されたエンティティを抽出する語彙制約機械翻訳の新たな利用法を提案する。
これらのデータセットに基づいて微調整されたモデルは、複数の抽出されたQAデータセット上で、先行合成データ生成モデルより優れていることを示す。
論文 参考訳(メタデータ) (2023-04-24T15:46:26Z) - QASem Parsing: Text-to-text Modeling of QA-based Semantics [19.42681342441062]
本稿では,QA-SRL,QANom,QADiscourseの3つの意味的タスクについて考察する。
最初に統合されたQASem解析ツールをリリースし、下流アプリケーションに実用的です。
論文 参考訳(メタデータ) (2022-05-23T15:56:07Z) - SA-VQA: Structured Alignment of Visual and Semantic Representations for
Visual Question Answering [29.96818189046649]
本稿では,視覚とテキストのグラフ表現を扱う構造化アライメントを提案する。
実験結果に示すように,このような構造的アライメントは推論性能を向上させる。
提案したモデルは、事前トレーニングなしで、GQAデータセット上で最先端の手法を上回り、VQA-v2データセット上で非事前トレーニングされた最先端の手法を上回ります。
論文 参考訳(メタデータ) (2022-01-25T22:26:09Z) - Extending Multi-Text Sentence Fusion Resources via Pyramid Annotations [12.394777121890925]
本稿では、過去のデータセット作成の取り組みを再考し、大幅に拡張する。
拡張版では、複数のドキュメントタスクにもっと代表的なテキストを使用し、より大きく、より多様なトレーニングセットを提供しています。
論文 参考訳(メタデータ) (2021-10-09T09:15:05Z) - Nutribullets Hybrid: Multi-document Health Summarization [36.95954983680022]
本稿では,入力文書の類似性と矛盾を強調する比較要約を生成する手法を提案する。
私たちのフレームワークは、より忠実で関連性があり、集約に敏感な要約につながります。
論文 参考訳(メタデータ) (2021-04-08T01:44:29Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Pairwise Representation Learning for Event Coreference [73.10563168692667]
イベント参照ペアのためのペアワイズ表現学習(Pairwise Representation Learning, PairwiseRL)手法を開発した。
私たちの表現は、イベントとその引数のエンコーディングを容易にするために、テキストスニペットのより微細で構造化された表現をサポートします。
PairwiseRLは、その単純さにもかかわらず、クロスドキュメントとイントラドキュメントのイベントコアベンチマークベンチマークの両方において、従来の最先端のイベントコアシステムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T06:55:52Z) - Query Focused Multi-Document Summarization with Distant Supervision [88.39032981994535]
既存の作業は、クエリとテキストセグメント間の関連性を推定する検索スタイルの手法に大きく依存している。
本稿では,クエリに関連するセグメントを推定するための個別モジュールを導入した粗大なモデリングフレームワークを提案する。
我々のフレームワークは、標準QFSベンチマークにおいて、強力な比較システムよりも優れていることを実証する。
論文 参考訳(メタデータ) (2020-04-06T22:35:19Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。