論文の概要: Identifying Experts in Question & Answer Portals: A Case Study on Data
Science Competencies in Reddit
- arxiv url: http://arxiv.org/abs/2204.04098v2
- Date: Thu, 1 Sep 2022 21:21:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 16:12:41.632238
- Title: Identifying Experts in Question & Answer Portals: A Case Study on Data
Science Competencies in Reddit
- Title(参考訳): 質問&回答ポータルのエキスパートを特定する:Redditのデータサイエンス能力に関するケーススタディ
- Authors: Sofia Strukova, Jos\'e A. Ruip\'erez-Valiente, F\'elix G\'omez
M\'armol
- Abstract要約: Redditにおけるデータサイエンスの専門家の特定の可能性について検討する。
本手法は,2人のデータサイエンス専門家が専門家と専門家以外のコメントだけでなく,スコープ外コメントをラベル付けした手作業によるコーディング結果に基づいている。
我々は,1,113のラベル付きコメントと100,226の未ラベル付きコメントを組み合わせた半教師付きアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The irreplaceable key to the triumph of Question & Answer (Q&A) platforms is
their users providing high-quality answers to the challenging questions posted
across various topics of interest. From more than a decade, the expert finding
problem attracted much attention in information retrieval research. Based on
the encountered gaps in the expert identification across several Q&A portals,
we inspect the feasibility of identifying data science experts in Reddit. Our
method is based on the manual coding results where two data science experts
labelled not only expert and non-expert comments, but also out-of-scope
comments, which is a novel contribution to the literature, enabling the
identification of more groups of comments across web portals. We present a
semi-supervised approach which combines 1,113 labelled comments with 100,226
unlabelled comments during training. The proposed model uses the activity
behaviour of every user, including Natural Language Processing (NLP),
crowdsourced and user feature sets. We conclude that the NLP and user feature
sets contribute the most to the better identification of these three classes.
It means that this method can generalise well within the domain. Finally, we
make a novel contribution by presenting different types of users in Reddit,
which opens many future research directions.
- Abstract(参考訳): 質問と回答の勝利(q&a)の鍵となるのは、さまざまなトピックにまたがる難題に対する、高品質な回答を提供するユーザだ。
10年以上にわたり、専門家による検索問題は情報検索研究に多くの注目を集めた。
いくつかのQ&Aポータルにまたがる専門家の識別に遭遇するギャップに基づき、Redditでデータサイエンスの専門家を特定する可能性を検討する。
本手法は,2人のデータサイエンス専門家が専門家と専門家以外のコメントだけでなく,文献への新たな貢献であるスコープ外コメントをラベル付けし,Webポータル全体にわたるコメントのグループの特定を可能にする,手作業によるコーディング結果に基づいている。
1,113のラベル付きコメントと100,226の未ラベルのコメントを組み合わせた半教師付きアプローチを提案する。
提案モデルは,自然言語処理(NLP)やクラウドソース,ユーザ機能セットなど,すべてのユーザの行動を利用する。
NLPとユーザ機能セットはこれらの3つのクラスをよりよく識別するのに最も役立ちます。
これは、このメソッドがドメイン内でうまく一般化できることを意味する。
最後に、redditでさまざまなタイプのユーザーを提示することで、新たな貢献を行ないます。
関連論文リスト
- Backtracing: Retrieving the Cause of the Query [7.715089044732362]
本稿では,ユーザクエリを最も引き起こす可能性のあるテキストセグメントをシステムで検索する,バックトラシングのタスクを紹介する。
人気情報検索手法と言語モデリング手法のゼロショット性能を評価する。
以上の結果から,後方追跡には改善の余地があり,新たな検索手法が必要であることが示唆された。
論文 参考訳(メタデータ) (2024-03-06T18:59:02Z) - Towards Self-Contained Answers: Entity-Based Answer Rewriting in
Conversational Search [19.147174273221452]
本稿では,利用者が外部サービスや情報源を使わずに理解できるように,CISで回答を書き換える方法について検討する。
最初のコントリビューションとして、正当性のためのエンティティに注釈付けされた会話のデータセットを作成しました。
第2のコントリビューションとして,CIS全体のユーザエクスペリエンス向上を目的とした2つの回答書き直し戦略を提案する。
論文 参考訳(メタデータ) (2024-03-04T05:52:41Z) - Inclusiveness Matters: A Large-Scale Analysis of User Feedback [7.8788463395442045]
Reddit、Google Play Store、Twitterの3つの人気オンラインソースからのユーザーフィードバックを、世界で最も人気のあるアプリ50に活用しています。
社会・技術基盤理論のアプローチを用いて,3つの情報源にまたがる23,107の投稿を分析し,1,211の包括性関連投稿を同定した。
本研究は、最も人気のあるアプリやオンラインソースからの包括性に関するユーザフィードバックを詳細に分析する。
論文 参考訳(メタデータ) (2023-11-02T04:05:46Z) - ExpertQA: Expert-Curated Questions and Attributed Answers [54.764273324907684]
本稿では,いくつかのシステムから得られる様々な事実と帰属の軸を解析する評価研究について述べる。
まず、32分野にわたる484人の被験者から専門家による質問を収集し、同じ専門家に自身の質問に対する回答を評価する。
また、専門家に言語モデルによる回答の修正を依頼し、32分野にわたる2177の質問からなる高品質の長文QAデータセットであるExpertQAを導いた。
論文 参考訳(メタデータ) (2023-09-14T16:54:34Z) - Best-Answer Prediction in Q&A Sites Using User Information [2.982218441172364]
コミュニティ質問回答 (CQA) サイトは近年, 大きく普及している。
そのような答えを見つけるための実践的な方法は、既存の回答とコメントが与えられた最高の候補を自動的に予測することです。
本稿では,質問者の背景情報やその他の特徴を用いて,最適な回答を予測するための新しい手法を用いて,この制限に対処する。
論文 参考訳(メタデータ) (2022-12-15T02:28:52Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Advances and Challenges in Conversational Recommender Systems: A Survey [133.93908165922804]
現在の会話レコメンダーシステム(CRS)で使用されるテクニックの体系的なレビューを提供します。
CRS開発の主な課題を5つの方向にまとめます。
これらの研究の方向性は、情報検索(IR)、自然言語処理(NLP)、人間とコンピュータの相互作用(HCI)などの複数の研究分野を含みます。
論文 参考訳(メタデータ) (2021-01-23T08:53:15Z) - Knowledge-Routed Visual Question Reasoning: Challenges for Deep
Representation Embedding [140.5911760063681]
VQAモデル評価のためのナレッジルーティング視覚質問推論という新しいデータセットを提案する。
視覚ゲノムシーングラフと外部知識ベースの両方に基づいて,制御プログラムを用いて質問応答対を生成する。
論文 参考訳(メタデータ) (2020-12-14T00:33:44Z) - An Empirical Study of Clarifying Question-Based Systems [15.767515065224016]
実験システムをデプロイしてオンライン実験を行い、プロダクトリポジトリに対して明確な質問をすることでユーザと対話する。
暗黙的なインタラクション行動データと,ユーザからの明示的なフィードバックの両方を収集する。 (a)ユーザは,多くの明確な質問(平均11~21件)に回答する意思がありますが,それ以上は多くありません。
論文 参考訳(メタデータ) (2020-08-01T15:10:11Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z) - Deep Learning for Person Re-identification: A Survey and Outlook [233.36948173686602]
人物再識別(Re-ID)は、複数の重複しないカメラを通して興味ある人物を検索することを目的としている。
人物のRe-IDシステム開発に関わるコンポーネントを分離することにより、それをクローズドワールドとオープンワールドのセッティングに分類する。
論文 参考訳(メタデータ) (2020-01-13T12:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。