論文の概要: HeteroQA: Learning towards Question-and-Answering through Multiple
Information Sources via Heterogeneous Graph Modeling
- arxiv url: http://arxiv.org/abs/2112.13597v1
- Date: Mon, 27 Dec 2021 10:16:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-28 15:07:18.551110
- Title: HeteroQA: Learning towards Question-and-Answering through Multiple
Information Sources via Heterogeneous Graph Modeling
- Title(参考訳): HeteroQA:異種グラフモデリングによる複数の情報ソースによる質問・回答の学習
- Authors: Shen Gao, Yuchi Zhang, Yongliang Wang, Yang Dong, Xiuying Chen,
Dongyan Zhao and Rui Yan
- Abstract要約: コミュニティ質問回答(Community Question Answering, CQA)は、Eコマースやオンラインユーザコミュニティなど、多くのシナリオで利用することができる、明確に定義されたタスクである。
CQAの手法のほとんどは、知識を抽出し、ユーザの質問に答えるために記事やウィキペディアしか含まない。
ユーザコミュニティに複数の情報ソース(MIS)を組み込んで回答を自動的に生成する問合せ対応の異種グラフ変換器を提案する。
- 参考スコア(独自算出の注目度): 50.39787601462344
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Community Question Answering (CQA) is a well-defined task that can be used in
many scenarios, such as E-Commerce and online user community for special
interests.
In these communities, users can post articles, give comment, raise a question
and answer it.
These data form the heterogeneous information sources where each information
source have their own special structure and context (comments attached to an
article or related question with answers).
Most of the CQA methods only incorporate articles or Wikipedia to extract
knowledge and answer the user's question.
However, various types of information sources in the community are not fully
explored by these CQA methods and these multiple information sources (MIS) can
provide more related knowledge to user's questions.
Thus, we propose a question-aware heterogeneous graph transformer to
incorporate the MIS in the user community to automatically generate the answer.
To evaluate our proposed method, we conduct the experiments on two datasets:
$\text{MSM}^{\text{plus}}$ the modified version of benchmark dataset MS-MARCO
and the AntQA dataset which is the first large-scale CQA dataset with four
types of MIS.
Extensive experiments on two datasets show that our model outperforms all the
baselines in terms of all the metrics.
- Abstract(参考訳): コミュニティ質問回答(Community Question Answering, CQA)は、Eコマースやオンラインユーザコミュニティなど、多くのシナリオで利用することができる、明確に定義されたタスクである。
これらのコミュニティでは、ユーザーは記事の投稿、コメントの投稿、質問の募集、それに答えることができる。
これらのデータは、各情報ソースが独自の特殊構造と文脈(記事や関連質問に添付された記事)を持つ異種情報ソースを形成する。
CQAの手法のほとんどは、知識を抽出し、ユーザの質問に答えるために記事やウィキペディアしか含まない。
しかし、コミュニティ内の様々な情報ソースはこれらのCQA手法によって完全には探索されておらず、これらの複数の情報ソース(MIS)は、ユーザの質問にもっと関連性のある知識を提供することができる。
そこで本研究では,MISをユーザコミュニティに組み込んで回答を自動的に生成する問合せ対応の異種グラフ変換器を提案する。
提案手法を評価するために、ベンチマークデータセットMS-MARCOの修正版である$\text{MSM}^{\text{plus}}と、4種類のMISを持つ最初の大規模CQAデータセットであるAntQAデータセットの2つのデータセットで実験を行った。
2つのデータセットに対する大規模な実験は、我々のモデルがすべての指標ですべてのベースラインを上回っていることを示している。
関連論文リスト
- NewsQs: Multi-Source Question Generation for the Inquiring Mind [62.36817838718306]
我々は複数のニュース文書に対して質問応答ペアを提供するデータセットであるNewsQsを紹介する。
FAQスタイルのニュース記事に微調整されたT5-Largeモデルによって自動生成される質問を,従来のマルチドキュメント要約データセットに拡張する。
論文 参考訳(メタデータ) (2024-02-28T16:59:35Z) - S2M: Converting Single-Turn to Multi-Turn Datasets for Conversational
Question Answering [16.930522435912717]
本稿では,シングルターンデータセットをマルチターンデータセットに変換する新しい手法を提案する。
S2Mは応募時にQuACのリーダーボードで1位にランクインした。
論文 参考訳(メタデータ) (2023-12-27T10:41:18Z) - UNK-VQA: A Dataset and A Probe into Multi-modal Large Models' Abstention
Ability [51.812099161015745]
本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文 参考訳(メタデータ) (2023-10-17T02:38:09Z) - MQAG: Multiple-choice Question Answering and Generation for Assessing
Information Consistency in Summarization [55.60306377044225]
最先端の要約システムは高度に流動的な要約を生成することができる。
しかし、これらの要約には、情報源に存在しない事実上の矛盾や情報が含まれている可能性がある。
本稿では,ソース情報と要約情報を直接比較する,標準的な情報理論に基づく代替手法を提案する。
論文 参考訳(メタデータ) (2023-01-28T23:08:25Z) - Relation-Aware Language-Graph Transformer for Question Answering [21.244992938222246]
本稿では,言語とグラフを関連づける質問応答変換器(QAT, Question Answering Transformer)を提案する。
具体的には、QATはメタパストークンを構築し、多様な構造的および意味的関係に基づいて関係中心の埋め込みを学習する。
我々は,CommonsenseQA や OpenBookQA などの常識質問応答データセットと,医療質問応答データセット MedQA-USMLE について,QAT の有効性を検証する。
論文 参考訳(メタデータ) (2022-12-02T05:10:10Z) - Summarizing Community-based Question-Answer Pairs [5.680726650578754]
本稿では,CQAペアから簡潔な要約を作成することを目的とした,新しいCQA要約タスクを提案する。
私たちのデータとコードは公開されています。
論文 参考訳(メタデータ) (2022-11-17T21:09:41Z) - Question Answering Survey: Directions, Challenges, Datasets, Evaluation
Matrices [0.0]
QA分野の研究の方向性は,質問の種類,回答の種類,根拠の源泉,モデリングアプローチに基づいて分析される。
これに続き、自動質問生成、類似性検出、言語に対する低リソース可用性など、この分野のオープンな課題が続きます。
論文 参考訳(メタデータ) (2021-12-07T08:53:40Z) - SYGMA: System for Generalizable Modular Question Answering OverKnowledge
Bases [57.89642289610301]
SYGMAは、複数の知識ベースと複数のリアソニングタイプにまたがる汎用化を容易にするモジュラーアプローチである。
本システムの有効性を,DBpediaとWikidataの2つの異なる知識ベースに属するデータセットを用いて評価することで実証する。
論文 参考訳(メタデータ) (2021-09-28T01:57:56Z) - FeTaQA: Free-form Table Question Answering [33.018256483762386]
FeTaQAは10Kのウィキペディアベースのテーブル、質問、自由形式の回答、テーブルセルペアをサポートする新しいデータセットである。
FeTaQAは、構造化された知識ソースから複数の不連続な事実の検索、推論、および統合後に自由形式のテキスト回答を生成する必要があるため、より困難なテーブル質問回答設定を提供する。
論文 参考訳(メタデータ) (2021-04-01T09:59:40Z) - Generating Diverse and Consistent QA pairs from Contexts with
Information-Maximizing Hierarchical Conditional VAEs [62.71505254770827]
非構造化テキストを文脈として与えられたQAペアを生成するための条件付き変分オートエンコーダ(HCVAE)を提案する。
我々のモデルは、トレーニングにわずかなデータしか使わず、両方のタスクの全てのベースラインに対して印象的なパフォーマンス向上が得られる。
論文 参考訳(メタデータ) (2020-05-28T08:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。