論文の概要: Answer ranking in Community Question Answering: a deep learning approach
- arxiv url: http://arxiv.org/abs/2212.01218v1
- Date: Sun, 16 Oct 2022 18:47:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-22 09:29:56.613939
- Title: Answer ranking in Community Question Answering: a deep learning approach
- Title(参考訳): コミュニティ質問応答における回答ランキング:深層学習アプローチ
- Authors: Lucas Valentin
- Abstract要約: 本研究は, 地域質問回答の回答ランキングを, 深層学習のアプローチで進めることによって, 技術の現状を推し進めるものである。
Stack OverflowのWebサイトにポストされた質問と回答の大規模なデータセットを作成しました。
我々は,高密度埋め込みとLSTMネットワークの自然言語処理機能を利用して,受理された応答属性の予測を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Community Question Answering is the field of computational linguistics that
deals with problems derived from the questions and answers posted to websites
such as Quora or Stack Overflow. Among some of these problems we find the issue
of ranking the multiple answers posted in reply to each question by how
informative they are in the attempt to solve the original question. This work
tries to advance the state of the art on answer ranking for community Question
Answering by proceeding with a deep learning approach. We started off by
creating a large data set of questions and answers posted to the Stack Overflow
website.
We then leveraged the natural language processing capabilities of dense
embeddings and LSTM networks to produce a prediction for the accepted answer
attribute, and present the answers in a ranked form ordered by how likely they
are to be marked as accepted by the question asker. We also produced a set of
numerical features to assist with the answer ranking task. These numerical
features were either extracted from metadata found in the Stack Overflow posts
or derived from the questions and answers texts. We compared the performance of
our deep learning models against a set of forest and boosted trees ensemble
methods and found that our models could not improve the best baseline results.
We speculate that this lack of performance improvement versus the baseline
models may be caused by the large number of out of vocabulary words present in
the programming code snippets found in the questions and answers text. We
conclude that while a deep learning approach may be helpful in answer ranking
problems new methods should be developed to assist with the large number of out
of vocabulary words present in the programming code snippets
- Abstract(参考訳): コミュニティ質問応答(community question answering)は、quoraやstack overflowなどのウェブサイトに投稿された質問や回答に由来する問題を扱う計算言語学の分野である。
これらの問題のうち、各質問への回答に投稿された複数の回答をランク付けする問題は、元の質問を解こうとして、彼らがどれだけ有益であるかを判断する。
本研究は, コミュニティ質問回答における回答ランク付け技術の現状を, 深層学習のアプローチで進めることを目的としている。
最初に、Stack OverflowのWebサイトに投稿された質問と回答の大規模なデータセットを作成しました。
そこで我々は,密着型埋め込みとLSTMネットワークの自然言語処理機能を活用して,回答属性の予測を行い,回答が質問者によって受け入れられる確率でランク付けされた形で提示する。
また,回答のランク付けを支援する数値的特徴のセットを作成した。
これらの数値的特徴はstack overflowの投稿にあるメタデータから抽出するか、質問と回答のテキストから抽出された。
我々のディープラーニングモデルのパフォーマンスを,森林群とブースタード・ツリー・アンサンブルの手法と比較し,モデルが最良のベースライン結果を改善することができないことを発見した。
ベースラインモデルに対するパフォーマンス改善の欠如は、質問や回答のテキストにあるプログラミング言語のスニペットに存在する語彙の欠如によって引き起こされる可能性があると推測する。
我々は、ディープラーニングアプローチはランキング問題に答えるのに役立つかもしれないが、プログラムコードスニペットに存在する多数の語彙単語を支援する新しい手法を開発するべきであると結論付けた。
関連論文リスト
- Answering Ambiguous Questions with a Database of Questions, Answers, and
Revisions [95.92276099234344]
ウィキペディアから生成される曖昧な質問のデータベースを利用して、あいまいな質問に答えるための新しい最先端技術を提案する。
提案手法は,リコール対策で15%,予測出力から不明瞭な質問を評価する尺度で10%向上する。
論文 参考訳(メタデータ) (2023-08-16T20:23:16Z) - Best-Answer Prediction in Q&A Sites Using User Information [2.982218441172364]
コミュニティ質問回答 (CQA) サイトは近年, 大きく普及している。
そのような答えを見つけるための実践的な方法は、既存の回答とコメントが与えられた最高の候補を自動的に予測することです。
本稿では,質問者の背景情報やその他の特徴を用いて,最適な回答を予測するための新しい手法を用いて,この制限に対処する。
論文 参考訳(メタデータ) (2022-12-15T02:28:52Z) - GooAQ: Open Question Answering with Diverse Answer Types [63.06454855313667]
さまざまな回答型を持つ大規模データセットであるGooAQを紹介する。
このデータセットには500万の質問と300万の回答が含まれている。
論文 参考訳(メタデータ) (2021-04-18T05:40:39Z) - Attention-based model for predicting question relatedness on Stack
Overflow [0.0]
Stack Overflowにおける質問間の関連性を自動的に予測するアテンションベースの文対相互作用モデル(ASIM)を提案する。
ASIMは、Precision、Recall、Micro-F1評価メトリクスのベースラインアプローチを大幅に改善しました。
私たちのモデルは、Ask Ubuntuの重複質問検出タスクでもうまく機能します。
論文 参考訳(メタデータ) (2021-03-19T12:18:03Z) - Features that Predict the Acceptability of Java and JavaScript Answers
on Stack Overflow [5.332217496693262]
私たちは、最も人気のある2つのタグ(JavaとJavaScript)の質問と回答を分析してStack Overflowデータセットを調査しました。
その結果,回答中のコードの長さ,ユーザの評判,質問と回答間のテキストの類似性,質問と回答間の時間ラグは,受け入れられない回答と受け入れられない回答を区別する最も高い予測力を有することがわかった。
論文 参考訳(メタデータ) (2021-01-08T03:09:38Z) - Brain-inspired Search Engine Assistant based on Knowledge Graph [53.89429854626489]
developerbotは脳にインスパイアされた、knowledge graphの名前の検索エンジンアシスタントだ。
複雑なマルチ制約クエリを複数の順序制約に分割することで、多層クエリグラフを構築する。
次に、制約推論プロセスを認知科学の拡散活性化モデルに触発されたサブグラフ探索プロセスとしてモデル化する。
論文 参考訳(メタデータ) (2020-12-25T06:36:11Z) - Few-Shot Complex Knowledge Base Question Answering via Meta
Reinforcement Learning [55.08037694027792]
複雑な質問答え(CQA)は、知識ベース(KB)上の複雑な自然言語質問に答える。
従来のニューラルプログラム誘導(NPI)アプローチは、質問の種類が異なる場合、不均一なパフォーマンスを示す。
本稿では,CQAにおけるプログラム誘導のためのメタ強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-29T18:34:55Z) - Retrieve, Program, Repeat: Complex Knowledge Base Question Answering via
Alternate Meta-learning [56.771557756836906]
本稿では,弱い監督からプログラマと交互に検索モデルを自動的に学習する手法を提案する。
本システムでは,知識ベースに対する複雑な質問応答を行う大規模タスクにおいて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-10-29T18:28:16Z) - Improving Quality of a Post's Set of Answers in Stack Overflow [2.0625936401496237]
Stack Overflowの低品質な投稿の多くは改善を必要としている。
本稿では,このような投稿の識別プロセスを自動化し,回答の集合を強化するアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-30T19:40:19Z) - Unsupervised Question Decomposition for Question Answering [102.56966847404287]
本論文では, ワンツーNアン教師付きシーケンスシーケンス(ONUS)のアルゴリズムを提案する。
当初,ドメイン外,マルチホップ開発セットのベースラインが強かったため,HotpotQAでは大きなQA改善が見られた。
論文 参考訳(メタデータ) (2020-02-22T19:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。