論文の概要: Identifying Experts in Question & Answer Portals: A Case Study on Data
Science Competencies in Reddit
- arxiv url: http://arxiv.org/abs/2204.04098v2
- Date: Thu, 1 Sep 2022 21:21:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 16:12:41.632238
- Title: Identifying Experts in Question & Answer Portals: A Case Study on Data
Science Competencies in Reddit
- Title(参考訳): 質問&回答ポータルのエキスパートを特定する:Redditのデータサイエンス能力に関するケーススタディ
- Authors: Sofia Strukova, Jos\'e A. Ruip\'erez-Valiente, F\'elix G\'omez
M\'armol
- Abstract要約: Redditにおけるデータサイエンスの専門家の特定の可能性について検討する。
本手法は,2人のデータサイエンス専門家が専門家と専門家以外のコメントだけでなく,スコープ外コメントをラベル付けした手作業によるコーディング結果に基づいている。
我々は,1,113のラベル付きコメントと100,226の未ラベル付きコメントを組み合わせた半教師付きアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The irreplaceable key to the triumph of Question & Answer (Q&A) platforms is
their users providing high-quality answers to the challenging questions posted
across various topics of interest. From more than a decade, the expert finding
problem attracted much attention in information retrieval research. Based on
the encountered gaps in the expert identification across several Q&A portals,
we inspect the feasibility of identifying data science experts in Reddit. Our
method is based on the manual coding results where two data science experts
labelled not only expert and non-expert comments, but also out-of-scope
comments, which is a novel contribution to the literature, enabling the
identification of more groups of comments across web portals. We present a
semi-supervised approach which combines 1,113 labelled comments with 100,226
unlabelled comments during training. The proposed model uses the activity
behaviour of every user, including Natural Language Processing (NLP),
crowdsourced and user feature sets. We conclude that the NLP and user feature
sets contribute the most to the better identification of these three classes.
It means that this method can generalise well within the domain. Finally, we
make a novel contribution by presenting different types of users in Reddit,
which opens many future research directions.
- Abstract(参考訳): 質問と回答の勝利(q&a)の鍵となるのは、さまざまなトピックにまたがる難題に対する、高品質な回答を提供するユーザだ。
10年以上にわたり、専門家による検索問題は情報検索研究に多くの注目を集めた。
いくつかのQ&Aポータルにまたがる専門家の識別に遭遇するギャップに基づき、Redditでデータサイエンスの専門家を特定する可能性を検討する。
本手法は,2人のデータサイエンス専門家が専門家と専門家以外のコメントだけでなく,文献への新たな貢献であるスコープ外コメントをラベル付けし,Webポータル全体にわたるコメントのグループの特定を可能にする,手作業によるコーディング結果に基づいている。
1,113のラベル付きコメントと100,226の未ラベルのコメントを組み合わせた半教師付きアプローチを提案する。
提案モデルは,自然言語処理(NLP)やクラウドソース,ユーザ機能セットなど,すべてのユーザの行動を利用する。
NLPとユーザ機能セットはこれらの3つのクラスをよりよく識別するのに最も役立ちます。
これは、このメソッドがドメイン内でうまく一般化できることを意味する。
最後に、redditでさまざまなタイプのユーザーを提示することで、新たな貢献を行ないます。
関連論文リスト
- Bottom-up Anytime Discovery of Generalised Multimodal Graph Patterns for Knowledge Graphs [0.0]
本稿では,知識グラフにおける一般化マルチモーダルグラフパターンのボトムアップ発見のためのアルゴリズムを提案する。
発見されると、パターンはSPARQLクエリに変換され、インタラクティブなファセットブラウザで表示される。
我々は,人文科学分野の専門家の助けを借りて,ユーザの視点から評価を行った。
論文 参考訳(メタデータ) (2024-10-08T09:07:27Z) - Leveraging Topic Specificity and Social Relationships for Expert Finding in Community Question Answering Platforms [5.723916517485655]
本稿では,エキスパート検索のためのトピック指向ユーザインタラクションモデルTUEFを提案する。
TUEFは、多層グラフを構築することで、コンテンツとソーシャルデータを統合する。
実験の結果、TUEFはP@1で42.42%、NDCG@3で32.73%、R@5で21.76%、MRRで29.81%という最低パフォーマンスで全てのライバルを上回った。
論文 参考訳(メタデータ) (2024-07-04T15:50:18Z) - QAGCF: Graph Collaborative Filtering for Q&A Recommendation [58.21387109664593]
質問と回答(Q&A)プラットフォームは通常、ユーザの知識獲得のニーズを満たすために質問と回答のペアを推奨する。
これにより、ユーザの振る舞いがより複雑になり、Q&Aレコメンデーションの2つの課題が提示される。
グラフニューラルネットワークモデルであるQ&Answer Graph Collaborative Filtering (QAGCF)を導入する。
論文 参考訳(メタデータ) (2024-06-07T10:52:37Z) - Inclusiveness Matters: A Large-Scale Analysis of User Feedback [7.8788463395442045]
Reddit、Google Play Store、Twitterの3つの人気オンラインソースからのユーザーフィードバックを、世界で最も人気のあるアプリ50に活用しています。
社会・技術基盤理論のアプローチを用いて,3つの情報源にまたがる23,107の投稿を分析し,1,211の包括性関連投稿を同定した。
本研究は、最も人気のあるアプリやオンラインソースからの包括性に関するユーザフィードバックを詳細に分析する。
論文 参考訳(メタデータ) (2023-11-02T04:05:46Z) - ExpertQA: Expert-Curated Questions and Attributed Answers [51.68314045809179]
我々は,様々な属性と事実の軸に沿って,いくつかの代表システムからの応答を人為的に評価する。
我々は32分野にわたる484人の被験者から専門家による質問を収集し、同じ専門家に自身の質問に対する反応を評価する。
分析の結果は,32分野にまたがる2177の質問と,回答の検証とクレームの属性を備えた高品質な長文QAデータセットであるExpertQAである。
論文 参考訳(メタデータ) (2023-09-14T16:54:34Z) - Best-Answer Prediction in Q&A Sites Using User Information [2.982218441172364]
コミュニティ質問回答 (CQA) サイトは近年, 大きく普及している。
そのような答えを見つけるための実践的な方法は、既存の回答とコメントが与えられた最高の候補を自動的に予測することです。
本稿では,質問者の背景情報やその他の特徴を用いて,最適な回答を予測するための新しい手法を用いて,この制限に対処する。
論文 参考訳(メタデータ) (2022-12-15T02:28:52Z) - Advances and Challenges in Conversational Recommender Systems: A Survey [133.93908165922804]
現在の会話レコメンダーシステム(CRS)で使用されるテクニックの体系的なレビューを提供します。
CRS開発の主な課題を5つの方向にまとめます。
これらの研究の方向性は、情報検索(IR)、自然言語処理(NLP)、人間とコンピュータの相互作用(HCI)などの複数の研究分野を含みます。
論文 参考訳(メタデータ) (2021-01-23T08:53:15Z) - Knowledge-Routed Visual Question Reasoning: Challenges for Deep
Representation Embedding [140.5911760063681]
VQAモデル評価のためのナレッジルーティング視覚質問推論という新しいデータセットを提案する。
視覚ゲノムシーングラフと外部知識ベースの両方に基づいて,制御プログラムを用いて質問応答対を生成する。
論文 参考訳(メタデータ) (2020-12-14T00:33:44Z) - An Empirical Study of Clarifying Question-Based Systems [15.767515065224016]
実験システムをデプロイしてオンライン実験を行い、プロダクトリポジトリに対して明確な質問をすることでユーザと対話する。
暗黙的なインタラクション行動データと,ユーザからの明示的なフィードバックの両方を収集する。 (a)ユーザは,多くの明確な質問(平均11~21件)に回答する意思がありますが,それ以上は多くありません。
論文 参考訳(メタデータ) (2020-08-01T15:10:11Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z) - Deep Learning for Person Re-identification: A Survey and Outlook [233.36948173686602]
人物再識別(Re-ID)は、複数の重複しないカメラを通して興味ある人物を検索することを目的としている。
人物のRe-IDシステム開発に関わるコンポーネントを分離することにより、それをクローズドワールドとオープンワールドのセッティングに分類する。
論文 参考訳(メタデータ) (2020-01-13T12:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。