論文の概要: Feature Engineering in Learning-to-Rank for Community Question Answering
Task
- arxiv url: http://arxiv.org/abs/2309.07610v1
- Date: Thu, 14 Sep 2023 11:18:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-15 15:18:05.222564
- Title: Feature Engineering in Learning-to-Rank for Community Question Answering
Task
- Title(参考訳): 地域質問応答課題における学習領域の特徴工学
- Authors: Nafis Sajid, Md Rashidul Hasan, Muhammad Ibrahim
- Abstract要約: コミュニティ質問応答(CQA)フォーラムはインターネットベースのプラットフォームで、ユーザーはトピックについて質問し、他の専門家はソリューションを提供しようとする。
Quora、Stackoverflow、Yahoo!Answer、StackExchangeといった多くのCQAフォーラムには、多くのユーザ生成データが存在する。
これらのデータは、ユーザの問い合わせに応じて類似の質問(と回答)が提示される自動CQAランキングシステムで活用される。
- 参考スコア(独自算出の注目度): 2.5091819952713057
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Community question answering (CQA) forums are Internet-based platforms where
users ask questions about a topic and other expert users try to provide
solutions. Many CQA forums such as Quora, Stackoverflow, Yahoo!Answer,
StackExchange exist with a lot of user-generated data. These data are leveraged
in automated CQA ranking systems where similar questions (and answers) are
presented in response to the query of the user. In this work, we empirically
investigate a few aspects of this domain. Firstly, in addition to traditional
features like TF-IDF, BM25 etc., we introduce a BERT-based feature that
captures the semantic similarity between the question and answer. Secondly,
most of the existing research works have focused on features extracted only
from the question part; features extracted from answers have not been explored
extensively. We combine both types of features in a linear fashion. Thirdly,
using our proposed concepts, we conduct an empirical investigation with
different rank-learning algorithms, some of which have not been used so far in
CQA domain. On three standard CQA datasets, our proposed framework achieves
state-of-the-art performance. We also analyze importance of the features we use
in our investigation. This work is expected to guide the practitioners to
select a better set of features for the CQA retrieval task.
- Abstract(参考訳): コミュニティ質問応答(CQA)フォーラムはインターネットベースのプラットフォームで、ユーザーはトピックについて質問し、他の専門家はソリューションを提供しようとする。
Quora、Stackoverflow、Yahoo!Answer、StackExchangeといった多くのCQAフォーラムには、多くのユーザ生成データが存在する。
これらのデータは、ユーザの問い合わせに応じて類似の質問(と回答)が提示される自動CQAランキングシステムで活用される。
本研究では,この領域のいくつかの側面を実証的に検討する。
まず、TF-IDF、BM25などの従来の機能に加えて、質問と回答のセマンティックな類似性をキャプチャするBERTベースの機能を導入します。
第2に,既存の研究は質問部分のみから抽出した特徴に着目しており,回答から抽出した特徴は広く調査されていない。
両方の特徴を線形に組み合わせます。
第3に、提案した概念を用いて、CQA領域ではこれまで使われていないような、異なるランク学習アルゴリズムによる実証的研究を行う。
3つの標準CQAデータセットにおいて,提案フレームワークは最先端の性能を実現する。
また,調査で使用する機能の重要性についても分析した。
この作業は,CQA検索タスクにおいて,より優れた機能セットを選択するための実践者を支援することが期待されている。
関連論文リスト
- Best-Answer Prediction in Q&A Sites Using User Information [2.982218441172364]
コミュニティ質問回答 (CQA) サイトは近年, 大きく普及している。
そのような答えを見つけるための実践的な方法は、既存の回答とコメントが与えられた最高の候補を自動的に予測することです。
本稿では,質問者の背景情報やその他の特徴を用いて,最適な回答を予測するための新しい手法を用いて,この制限に対処する。
論文 参考訳(メタデータ) (2022-12-15T02:28:52Z) - RealTime QA: What's the Answer Right Now? [137.04039209995932]
本稿では,動的質問応答(QA)プラットフォームであるREALTIME QAを紹介する。
GPT-3 や T5 など,大規模事前学習型言語モデルに基づく強力なベースラインモデルを構築した。
GPT-3は、検索された文書が答えを見つけるのに十分な情報を提供していない場合、時代遅れの回答を返す傾向がある。
論文 参考訳(メタデータ) (2022-07-27T07:26:01Z) - Multifaceted Improvements for Conversational Open-Domain Question
Answering [54.913313912927045]
対話型オープンドメイン質問回答(MICQA)のための多面的改善フレームワークを提案する。
第一に、提案したKL分割に基づく正規化は、検索と解答のためのより良い質問理解をもたらすことができる。
第二に、追加されたポストランカモジュールは、より関連性の高いパスをトップにプッシュし、2アスペクトの制約で読者に選択できる。
第3に、十分に設計されたカリキュラム学習戦略は、訓練と推論の黄金の通路設定のギャップを効果的に狭め、黄金の通路支援なしで真の答えを見つけることを奨励する。
論文 参考訳(メタデータ) (2022-04-01T07:54:27Z) - HeteroQA: Learning towards Question-and-Answering through Multiple
Information Sources via Heterogeneous Graph Modeling [50.39787601462344]
コミュニティ質問回答(Community Question Answering, CQA)は、Eコマースやオンラインユーザコミュニティなど、多くのシナリオで利用することができる、明確に定義されたタスクである。
CQAの手法のほとんどは、知識を抽出し、ユーザの質問に答えるために記事やウィキペディアしか含まない。
ユーザコミュニティに複数の情報ソース(MIS)を組み込んで回答を自動的に生成する問合せ対応の異種グラフ変換器を提案する。
論文 参考訳(メタデータ) (2021-12-27T10:16:43Z) - PerCQA: Persian Community Question Answering Dataset [2.503043323723241]
コミュニティ質問回答 (Community Question Answering, CQA) は、現実の質問に対する回答を提供するフォーラムである。
CQAの最初のペルシア語データセットであるPerCQAを提示する。
このデータセットには、最も有名なペルシアのフォーラムからクロールされた質問と回答が含まれている。
論文 参考訳(メタデータ) (2021-12-25T14:06:41Z) - QAConv: Question Answering on Informative Conversations [85.2923607672282]
ビジネスメールやパネルディスカッション,作業チャネルなど,情報的な会話に重点を置いています。
合計で、スパンベース、フリーフォーム、および回答不能な質問を含む34,204のQAペアを収集します。
論文 参考訳(メタデータ) (2021-05-14T15:53:05Z) - Attention-based model for predicting question relatedness on Stack
Overflow [0.0]
Stack Overflowにおける質問間の関連性を自動的に予測するアテンションベースの文対相互作用モデル(ASIM)を提案する。
ASIMは、Precision、Recall、Micro-F1評価メトリクスのベースラインアプローチを大幅に改善しました。
私たちのモデルは、Ask Ubuntuの重複質問検出タスクでもうまく機能します。
論文 参考訳(メタデータ) (2021-03-19T12:18:03Z) - Diverse and Non-redundant Answer Set Extraction on Community QA based on
DPPs [18.013010857062643]
コミュニティベースの質問応答プラットフォームでは、ユーザが多くの回答の中から有用な情報を得るのに時間がかかる。
本稿では,回答のランク付けよりも多様で非冗長な回答セットを選択することを提案する。
論文 参考訳(メタデータ) (2020-11-18T07:33:03Z) - Few-Shot Complex Knowledge Base Question Answering via Meta
Reinforcement Learning [55.08037694027792]
複雑な質問答え(CQA)は、知識ベース(KB)上の複雑な自然言語質問に答える。
従来のニューラルプログラム誘導(NPI)アプローチは、質問の種類が異なる場合、不均一なパフォーマンスを示す。
本稿では,CQAにおけるプログラム誘導のためのメタ強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-29T18:34:55Z) - DoQA -- Accessing Domain-Specific FAQs via Conversational QA [25.37327993590628]
2,437の対話と10,917のQAペアを持つデータセットであるDoQAを提示する。
対話は、クラウドソーシングを備えたWizard of Ozメソッドを使用して、3つのStack Exchangeサイトから収集される。
論文 参考訳(メタデータ) (2020-05-04T08:58:54Z) - Unsupervised Question Decomposition for Question Answering [102.56966847404287]
本論文では, ワンツーNアン教師付きシーケンスシーケンス(ONUS)のアルゴリズムを提案する。
当初,ドメイン外,マルチホップ開発セットのベースラインが強かったため,HotpotQAでは大きなQA改善が見られた。
論文 参考訳(メタデータ) (2020-02-22T19:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。