論文の概要: Nutribullets Hybrid: Multi-document Health Summarization
- arxiv url: http://arxiv.org/abs/2104.03465v1
- Date: Thu, 8 Apr 2021 01:44:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 01:05:28.933642
- Title: Nutribullets Hybrid: Multi-document Health Summarization
- Title(参考訳): Nutribullets Hybrid: マルチドキュメントヘルス要約
- Authors: Darsh J Shah, Lili Yu, Tao Lei and Regina Barzilay
- Abstract要約: 本稿では,入力文書の類似性と矛盾を強調する比較要約を生成する手法を提案する。
私たちのフレームワークは、より忠実で関連性があり、集約に敏感な要約につながります。
- 参考スコア(独自算出の注目度): 36.95954983680022
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a method for generating comparative summaries that highlights
similarities and contradictions in input documents. The key challenge in
creating such summaries is the lack of large parallel training data required
for training typical summarization systems. To this end, we introduce a hybrid
generation approach inspired by traditional concept-to-text systems. To enable
accurate comparison between different sources, the model first learns to
extract pertinent relations from input documents. The content planning
component uses deterministic operators to aggregate these relations after
identifying a subset for inclusion into a summary. The surface realization
component lexicalizes this information using a text-infilling language model.
By separately modeling content selection and realization, we can effectively
train them with limited annotations. We implemented and tested the model in the
domain of nutrition and health -- rife with inconsistencies. Compared to
conventional methods, our framework leads to more faithful, relevant and
aggregation-sensitive summarization -- while being equally fluent.
- Abstract(参考訳): 本稿では,入力文書の類似性と矛盾を強調する比較要約を生成する手法を提案する。
このような要約を作成する上で重要な課題は、典型的な要約システムのトレーニングに必要な大規模な並列トレーニングデータがないことである。
この目的のために,従来の概念対テキストシステムに触発されたハイブリッド生成手法を提案する。
異なるソース間の正確な比較を可能にするため、まず入力文書から関連する関係を抽出する。
コンテンツ計画コンポーネントは、決定論的演算子を使用して、要約に含めるサブセットを特定した後、これらの関係を集約する。
表面実現コンポーネントは、この情報をテキスト入力言語モデルを用いて語彙化する。
コンテンツ選択と実現を別々にモデル化することで、制限されたアノテーションで効果的にトレーニングすることができます。
私たちは、栄養と健康の領域でモデルを実装し、テストしました。
従来の手法と比較して、我々のフレームワークはより忠実で関連性があり、集約に敏感な要約をもたらします。
関連論文リスト
- Personalized Video Summarization using Text-Based Queries and Conditional Modeling [3.4447129363520337]
この論文は、テキストベースのクエリと条件付きモデリングを統合することで、ビデオ要約の強化を探求する。
精度やF1スコアなどの評価指標は、生成された要約の品質を評価する。
論文 参考訳(メタデータ) (2024-08-27T02:43:40Z) - Annotator in the Loop: A Case Study of In-Depth Rater Engagement to Create a Bridging Benchmark Dataset [1.825224193230824]
本稿では,アノテーションのための新規かつ協調的かつ反復的なアノテーション手法について述べる。
以上の結果から,アノテータとの連携によりアノテーションの手法が強化されることが示唆された。
論文 参考訳(メタデータ) (2024-08-01T19:11:08Z) - LBMT team at VLSP2022-Abmusu: Hybrid method with text correlation and
generative models for Vietnamese multi-document summarization [1.4716144941085147]
本稿では,クラスタ類似度に基づくマルチドキュメント要約手法を提案する。
各クラスタから最も重要な文を選択して要約を生成した後、BARTpho と ViT5 を用いて抽象モデルを構築する。
論文 参考訳(メタデータ) (2023-04-11T13:15:24Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Masked Summarization to Generate Factually Inconsistent Summaries for
Improved Factual Consistency Checking [28.66287193703365]
本稿では,キー情報を隠蔽したソーステキストと参照要約を用いて,現実的に一貫性のない要約を生成することを提案する。
7つのベンチマークデータセットを用いた実験により,提案手法を用いて生成した要約に基づいて訓練された実例整合性分類器が既存モデルを上回っていることが示された。
論文 参考訳(メタデータ) (2022-05-04T12:48:49Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。