論文の概要: PerCQA: Persian Community Question Answering Dataset
- arxiv url: http://arxiv.org/abs/2112.13238v1
- Date: Sat, 25 Dec 2021 14:06:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-28 16:10:43.395276
- Title: PerCQA: Persian Community Question Answering Dataset
- Title(参考訳): PerCQA: ペルシャのコミュニティ質問がデータセットに回答
- Authors: Naghme Jamali, Yadollah Yaghoobzadeh, Hesham Faili
- Abstract要約: コミュニティ質問回答 (Community Question Answering, CQA) は、現実の質問に対する回答を提供するフォーラムである。
CQAの最初のペルシア語データセットであるPerCQAを提示する。
このデータセットには、最も有名なペルシアのフォーラムからクロールされた質問と回答が含まれている。
- 参考スコア(独自算出の注目度): 2.503043323723241
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Community Question Answering (CQA) forums provide answers for many real-life
questions. Thanks to the large size, these forums are very popular among
machine learning researchers. Automatic answer selection, answer ranking,
question retrieval, expert finding, and fact-checking are example learning
tasks performed using CQA data. In this paper, we present PerCQA, the first
Persian dataset for CQA. This dataset contains the questions and answers
crawled from the most well-known Persian forum. After data acquisition, we
provide rigorous annotation guidelines in an iterative process, and then the
annotation of question-answer pairs in SemEvalCQA format. PerCQA contains 989
questions and 21,915 annotated answers. We make PerCQA publicly available to
encourage more research in Persian CQA. We also build strong benchmarks for the
task of answer selection in PerCQA by using mono- and multi-lingual pre-trained
language models
- Abstract(参考訳): コミュニティ質問回答 (Community Question Answering, CQA) は、現実の質問に対する回答を提供するフォーラムである。
大規模なため、これらのフォーラムは機械学習研究者の間で非常に人気がある。
自動回答選択、回答ランキング、質問検索、エキスパート検索、ファクトチェックは、CQAデータを用いて実行されるサンプル学習タスクである。
本稿では,CQAの最初のペルシア語データセットであるPerCQAを紹介する。
このデータセットには、最も有名なペルシアのフォーラムからクロールされた質問と回答が含まれている。
データ取得後、厳密なガイドラインを反復的なプロセスで提供し、SemEvalCQA形式の質問応答ペアのアノテーションを提供する。
PerCQAには989の質問と21,915の注釈付き回答が含まれている。
ペルシアのCQAの研究を促進するために、PerCQAを公開しています。
また,単言語および多言語事前学習言語モデルを用いて,PerCQAにおける回答選択作業のための強力なベンチマークを構築した。
関連論文リスト
- Feature Engineering in Learning-to-Rank for Community Question Answering
Task [2.5091819952713057]
コミュニティ質問応答(CQA)フォーラムはインターネットベースのプラットフォームで、ユーザーはトピックについて質問し、他の専門家はソリューションを提供しようとする。
Quora、Stackoverflow、Yahoo!Answer、StackExchangeといった多くのCQAフォーラムには、多くのユーザ生成データが存在する。
これらのデータは、ユーザの問い合わせに応じて類似の質問(と回答)が提示される自動CQAランキングシステムで活用される。
論文 参考訳(メタデータ) (2023-09-14T11:18:26Z) - Answering Ambiguous Questions with a Database of Questions, Answers, and
Revisions [95.92276099234344]
ウィキペディアから生成される曖昧な質問のデータベースを利用して、あいまいな質問に答えるための新しい最先端技術を提案する。
提案手法は,リコール対策で15%,予測出力から不明瞭な質問を評価する尺度で10%向上する。
論文 参考訳(メタデータ) (2023-08-16T20:23:16Z) - IfQA: A Dataset for Open-domain Question Answering under Counterfactual
Presuppositions [54.23087908182134]
本稿では,QA(FifQA)と呼ばれる,最初の大規模対実的オープンドメイン質問応答(QA)ベンチマークを紹介する。
IfQAデータセットには3,800以上の質問が含まれている。
IfQAベンチマークによって引き起こされるユニークな課題は、検索と対実的推論の両方に関して、オープンドメインのQA研究を促進することである。
論文 参考訳(メタデータ) (2023-05-23T12:43:19Z) - Summarizing Community-based Question-Answer Pairs [5.680726650578754]
本稿では,CQAペアから簡潔な要約を作成することを目的とした,新しいCQA要約タスクを提案する。
私たちのデータとコードは公開されています。
論文 参考訳(メタデータ) (2022-11-17T21:09:41Z) - Can Question Rewriting Help Conversational Question Answering? [13.484873786389471]
質問書き直し (QR) は会話型質問応答 (CQA) のサブタスクである。
本稿では,QRとCQAタスクを統合した強化学習手法について検討する。
しかし、RL法はエンドツーエンドのベースラインと同等であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T08:16:03Z) - ConditionalQA: A Complex Reading Comprehension Dataset with Conditional
Answers [93.55268936974971]
条件付き回答を含む複雑な質問を含む質問回答データセットについて述べる。
このデータセットを ConditionalQA と呼びます。
本稿では,既存のQAモデルの多く,特に回答条件の選択において,ConditionalQAは困難であることを示す。
論文 参考訳(メタデータ) (2021-10-13T17:16:46Z) - GooAQ: Open Question Answering with Diverse Answer Types [63.06454855313667]
さまざまな回答型を持つ大規模データセットであるGooAQを紹介する。
このデータセットには500万の質問と300万の回答が含まれている。
論文 参考訳(メタデータ) (2021-04-18T05:40:39Z) - ParaQA: A Question Answering Dataset with Paraphrase Responses for
Single-Turn Conversation [5.087932295628364]
ParaQAは知識グラフ(KG)上の1ターン会話のための複数のパラフレーズ応答を持つデータセットである
データセットは半自動的なフレームワークを使って、バックトランスレーションのようなテクニックを使って、さまざまな回答のパラフレージングを生成する。
論文 参考訳(メタデータ) (2021-03-13T18:53:07Z) - Few-Shot Complex Knowledge Base Question Answering via Meta
Reinforcement Learning [55.08037694027792]
複雑な質問答え(CQA)は、知識ベース(KB)上の複雑な自然言語質問に答える。
従来のニューラルプログラム誘導(NPI)アプローチは、質問の種類が異なる場合、不均一なパフォーマンスを示す。
本稿では,CQAにおけるプログラム誘導のためのメタ強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-29T18:34:55Z) - KQA Pro: A Dataset with Explicit Compositional Programs for Complex
Question Answering over Knowledge Base [67.87878113432723]
複雑KBQAのためのデータセットであるKQA Proを紹介する。
各質問に対して、対応するKoPLプログラムとSPARQLクエリを提供するので、KQA ProはKBQAとセマンティック解析の両方に役立ちます。
論文 参考訳(メタデータ) (2020-07-08T03:28:04Z) - CQ-VQA: Visual Question Answering on Categorized Questions [3.0013352260516744]
本稿では,視覚的質問応答(VQA)の課題を解決するために,新しい2階層型・エンドツーエンドモデルであるCQ-VQAを提案する。
質問分類器(QC)と呼ばれる第1レベルのCQ-VQAは、潜在的な回答検索スペースを減らすために質問を分類する。
第2のレベルは、回答予測器(AP)と呼ばれ、各質問カテゴリに対応する一組の別個の分類器から構成される。
論文 参考訳(メタデータ) (2020-02-17T06:45:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。