論文の概要: Characterizing and Classifying Developer Forum Posts with their
Intentions
- arxiv url: http://arxiv.org/abs/2312.14279v1
- Date: Thu, 21 Dec 2023 20:17:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-25 16:48:34.041571
- Title: Characterizing and Classifying Developer Forum Posts with their
Intentions
- Title(参考訳): 開発者フォーラム投稿の意図による特徴付けと分類
- Authors: Xingfang Wu, Eric Laufer, Heng Li, Foutse Khomh, Santhosh Srinivasan,
Jayden Luo
- Abstract要約: オンライン技術フォーラムの投稿数は急速に増えている。
ほとんどのタグは技術的な観点にのみ焦点をあてています。
ポストの意図をモデル化することは、現在のタグ分類に余分な次元を与えることができる。
- 参考スコア(独自算出の注目度): 11.075221350033537
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the rapid growth of the developer community, the amount of posts on
online technical forums has been growing rapidly, which poses difficulties for
users to filter useful posts and find important information. Tags provide a
concise feature dimension for users to locate their interested posts and for
search engines to index the most relevant posts according to the queries.
However, most tags are only focused on the technical perspective (e.g., program
language, platform, tool). In most cases, forum posts in online developer
communities reveal the author's intentions to solve a problem, ask for advice,
share information, etc. The modeling of the intentions of posts can provide an
extra dimension to the current tag taxonomy. By referencing previous studies
and learning from industrial perspectives, we create a refined taxonomy for the
intentions of technical forum posts. Through manual labeling and analysis on a
sampled post dataset extracted from online forums, we understand the relevance
between the constitution of posts (code, error messages) and their intentions.
Furthermore, inspired by our manual study, we design a pre-trained
transformer-based model to automatically predict post intentions. The best
variant of our intention prediction framework, which achieves a Micro F1-score
of 0.589, Top 1-3 accuracy of 62.6% to 87.8%, and an average AUC of 0.787,
outperforms the state-of-the-art baseline approach. Our characterization and
automated classification of forum posts regarding their intentions may help
forum maintainers or third-party tool developers improve the organization and
retrieval of posts on technical forums. We have released our annotated dataset
and codes in our supplementary material package.
- Abstract(参考訳): 開発者コミュニティの急速な成長に伴い、オンライン技術フォーラムの投稿数は急速に増加しており、ユーザーが有用な投稿をフィルタリングして重要な情報を見つけるのが困難になっている。
タグは、ユーザーが興味のある投稿を見つけるための簡潔な機能ディメンションを提供し、検索エンジンはクエリに応じて最も関連する投稿をインデックスする。
しかし、ほとんどのタグは技術的な観点(プログラム言語、プラットフォーム、ツールなど)にのみ焦点が当てられている。
多くの場合、オンライン開発者コミュニティのフォーラム投稿は、問題の解決やアドバイス、情報共有といった著者の意図を明らかにしている。
ポストの意図のモデル化は、現在のタグ分類に余分な次元を与えることができる。
産業的観点からの先行研究と学習を参考に,技術フォーラム投稿の意図を洗練した分類法を作成する。
オンラインフォーラムから抽出したサンプルポストデータセットのラベリングと分析により,ポストの構成(コード,エラーメッセージ)とそれらの意図との関係を解明する。
さらに,手動による研究に触発されて,姿勢を自動的に予測する事前学習型トランスフォーマーモデルの設計を行った。
マイクロf1-スコア0.589、トップ1-3の精度62.6%から87.8%、平均的なauc 0.787を達成する意図予測フレームワークの最良の変種は、最先端のベースラインアプローチを上回っている。
フォーラムのメンテナやサードパーティのツール開発者が、テクニカルフォーラムの投稿の整理や検索を改善する上で、フォーラム投稿の意図に関する特性と自動分類が役立ちます。
補足資料パッケージに注釈付きデータセットとコードをリリースしました。
関連論文リスト
- Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering [8.20929362102942]
著者プロファイルは、共有するコンテンツを分析して個人の特徴を推測するタスクである。
本稿では,関係のないコンテンツと関係のないコンテンツとを区別することを目的とした著者プロファイリング手法を提案し,それに続いて,関連データのみを用いて実際のユーザプロファイリングを行う。
2つのTwitterコーパスにおける5つの人格特性予測手法の評価を行った。
論文 参考訳(メタデータ) (2024-09-06T08:43:10Z) - UltraFeedback: Boosting Language Models with Scaled AI Feedback [99.4633351133207]
大規模で高品質で多様なAIフィードバックデータセットである textscUltraFeedback を提示する。
我々の研究は、強力なオープンソースのチャット言語モデルを構築する上で、スケールしたAIフィードバックデータの有効性を検証する。
論文 参考訳(メタデータ) (2023-10-02T17:40:01Z) - Towards Generalizable Detection of Urgency of Discussion Forum Posts [0.0]
MOOCなどのオンラインコースを受講している学生は、講座のディスカッションフォーラムを使って質問したり、問題に遭遇したときにインストラクターに連絡したりする。
我々は,各フォーラム投稿の緊急性を自動的に判断する予測モデルを構築し,これらの投稿をインストラクターの注意を惹きつけることができるようにした。
本稿は,2値決定のカットオフだけでなく,ポストの緊急度を7ポイントのスケールで予測することによって,これまでの作業を越えている。
論文 参考訳(メタデータ) (2023-07-14T20:21:50Z) - Exploring Large Language Model for Graph Data Understanding in Online
Job Recommendations [63.19448893196642]
本稿では,大規模言語モデルが提供するリッチな文脈情報と意味表現を利用して行動グラフを解析する新しいフレームワークを提案する。
この機能を利用することで、個々のユーザに対してパーソナライズされた、正確なジョブレコメンデーションが可能になる。
論文 参考訳(メタデータ) (2023-07-10T11:29:41Z) - Modeling Tag Prediction based on Question Tagging Behavior Analysis of
CommunityQA Platform Users [10.816557776555078]
我々は、各質問に対して人気のあるタグとより粒度の細かいタグの両方を予測するフレキシブルなニューラルタグ予測アーキテクチャを開発する。
実験結果と得られた性能から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2023-07-04T01:24:26Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - FETA: Towards Specializing Foundation Models for Expert Task
Applications [49.57393504125937]
ファンデーションモデル(FM)は、ゼロショット学習、高忠実度データ合成、ドメインの一般化など、前例のない機能を示した。
この論文では、FMは、まだ専門家のタスクにおいて、出来の悪いパフォーマンスを保っていることを示します。
本稿では,FMに技術資料の理解を促すことを目的として,その第1のFETAベンチマークを提案する。
論文 参考訳(メタデータ) (2022-09-08T08:47:57Z) - Urdu Speech and Text Based Sentiment Analyzer [1.4630964945453113]
本研究は,ユーザ評価に基づく新しいマルチクラスUrduデータセットを提案する。
提案したデータセットには1万のレビューが含まれており、人間の専門家によって慎重に2つのカテゴリに分類されている。
Naivebayes、Stanza、Textblob、Vader、Frairを含む5種類のレキシコンおよびルールベースのアルゴリズムが採用され、実験の結果、Flairが70%の精度で他のテストアルゴリズムより優れていることが示された。
論文 参考訳(メタデータ) (2022-07-19T10:11:22Z) - Identifying Experts in Question & Answer Portals: A Case Study on Data
Science Competencies in Reddit [0.0]
Redditにおけるデータサイエンスの専門家の特定の可能性について検討する。
本手法は,2人のデータサイエンス専門家が専門家と専門家以外のコメントだけでなく,スコープ外コメントをラベル付けした手作業によるコーディング結果に基づいている。
我々は,1,113のラベル付きコメントと100,226の未ラベル付きコメントを組み合わせた半教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-08T14:30:59Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。