論文の概要: Looking for related discussions on GitHub Discussions
- arxiv url: http://arxiv.org/abs/2206.11971v1
- Date: Thu, 23 Jun 2022 20:41:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 09:27:05.500046
- Title: Looking for related discussions on GitHub Discussions
- Title(参考訳): GitHubに関する議論の関連性を探る
- Authors: Marcia Lima, Igor Steinmacher, Denae Ford, Evangeline Liu, Grace
Vorreuter, Tayana Conte, Bruno Gadelha
- Abstract要約: GitHub Discussionsは、プラットフォーム上にホストされているユーザとコミュニティのメンバー間の共同ディスカッションを促進するための、ネイティブフォーラムである。
GitHub DiscussionsはPCQAフォーラムに似ているが、このような環境が直面しているのと同じような課題に直面している。
重複した投稿は、同じコンテンツ(そして正確なコピーかもしれない)を持っているが、ほぼ重複して、同様のトピックや情報を共有する。
本稿では,Sentence-BERT事前学習モデル,RD-Detectorに基づくアプローチを提案する。
- 参考スコア(独自算出の注目度): 18.688096673390586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software teams are increasingly adopting different tools and communication
channels to aid the software collaborative development model and coordinate
tasks. Among such resources, Programming Community-based Question Answering
(PCQA) forums have become widely used by developers. Such environments enable
developers to get and share technical information. Interested in supporting the
development and management of Open Source Software (OSS) projects, GitHub
announced GitHub Discussions - a native forum to facilitate collaborative
discussions between users and members of communities hosted on the platform. As
GitHub Discussions resembles PCQA forums, it faces challenges similar to those
faced by such environments, which include the occurrence of related discussions
(duplicates or near-duplicated posts). While duplicate posts have the same
content - and may be exact copies - near-duplicates share similar topics and
information. Both can introduce noise to the platform and compromise project
knowledge sharing. In this paper, we address the problem of detecting related
posts in GitHub Discussions. To do so, we propose an approach based on a
Sentence-BERT pre-trained model: the RD-Detector. We evaluated RD-Detector
using data from different OSS communities. OSS maintainers and Software
Engineering (SE) researchers manually evaluated the RD-Detector results, which
achieved 75% to 100% in terms of precision. In addition, maintainers pointed
out practical applications of the approach, such as merging the discussions'
threads and making discussions as comments on one another. OSS maintainers can
benefit from RD-Detector to address the labor-intensive task of manually
detecting related discussions and answering the same question multiple times.
- Abstract(参考訳): ソフトウェアチームは、ソフトウェア開発モデルと協調作業を支援するために、さまざまなツールやコミュニケーションチャネルを採用しています。
このようなリソースのうち、プログラミングコミュニティベースの質問応答(pcqa)フォーラムは開発者によって広く使われている。
このような環境により、開発者は技術情報を取得して共有することができる。
GitHubは、オープンソースソフトウェア(OSS)プロジェクトの開発と管理をサポートすることに興味を持ち、GitHub Discussionsを発表した。これは、プラットフォーム上にホストされているユーザとコミュニティの協力的な議論を促進するための、ネイティブフォーラムである。
GitHub DiscussionsはPCQAフォーラムに似ているが、関連する議論(重複や近重複投稿)の発生を含む、そのような環境が直面しているものに似た課題に直面している。
重複した投稿は、同じコンテンツ(そして正確なコピーかもしれない)を持っているが、ほぼ重複して、同様のトピックや情報を共有する。
どちらもプラットフォームにノイズをもたらし、プロジェクトの知識共有を妥協することができる。
本稿では,GitHubの議論における関連記事の検出問題に対処する。
そこで本研究では,Sentence-BERT事前学習モデル,RD-Detectorに基づくアプローチを提案する。
異なるOSSコミュニティのデータを用いてRD-Detectorを評価した。
OSSメンテナとソフトウェアエンジニアリング(SE)の研究者たちは、RD-Detectorの結果を手作業で評価し、精度の点で75%から100%を達成した。
さらにメンテナは、議論のスレッドをマージしたり、議論を互いにコメントするといった、このアプローチの実践的な応用を指摘した。
OSSメンテナはRD-Detectorの恩恵を受け、関連する議論を手作業で検出し、同じ質問に何度も回答する作業に対処することができる。
関連論文リスト
- CodeRAG-Bench: Can Retrieval Augment Code Generation? [78.37076502395699]
検索拡張生成を用いたコード生成の系統的,大規模な解析を行う。
まず、コード生成タスクの3つのカテゴリを含む総合的な評価ベンチマークであるCodeRAG-Benchをキュレートする。
CodeRAG-Bench上のトップパフォーマンスモデルについて、1つまたは複数のソースから検索したコンテキストを提供することにより検討する。
論文 参考訳(メタデータ) (2024-06-20T16:59:52Z) - Impact of the Availability of ChatGPT on Software Development: A Synthetic Difference in Differences Estimation using GitHub Data [49.1574468325115]
ChatGPTは、ソフトウェア生産効率を向上させるAIツールである。
10万人あたりのgitプッシュ数、リポジトリ数、ユニークな開発者数に対するChatGPTの影響を見積もっています。
これらの結果は、ChatGPTのようなAIツールが開発者の生産性を大幅に向上させる可能性があることを示唆している。
論文 参考訳(メタデータ) (2024-06-16T19:11:15Z) - How to Understand Whole Software Repository? [64.19431011897515]
リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。
本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。
リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - An Empirical Study on Developers Shared Conversations with ChatGPT in GitHub Pull Requests and Issues [20.121332699827633]
ChatGPTはソフトウェア開発プラクティスに大きな影響を与えています。
広く採用されているにもかかわらず、協調コーディングにおけるアシスタントとしてのChatGPTの影響はほとんど解明されていない。
210と370人の開発者のデータセットを分析し、GitHubのプルリクエスト(PR)とイシューでChatGPTとの会話を共有しました。
論文 参考訳(メタデータ) (2024-03-15T16:58:37Z) - Chronicles of CI/CD: A Deep Dive into its Usage Over Time [0.5705775078773656]
本稿では、GitHubリポジトリを分析し、開発者がCI/CDに使用する技術を分析する。
最先端のCI/CDテクノロジのリストを使用して、GitHub検索APIを使用して、それぞれのテクノロジを使用してリポジトリを見つけます。
当社の時代におけるCI/CDテクノロジの使用状況の概要に加えて,過去12年間に何が起こったのかについても紹介する。
論文 参考訳(メタデータ) (2024-02-27T15:20:11Z) - SWE-bench: Can Language Models Resolve Real-World GitHub Issues? [80.52201658231895]
SWE-benchは、実際のGitHub問題から引き出された2,294ドルのソフトウェアエンジニアリング問題と、人気のあるPythonリポジトリ12ドルのプルリクエストで構成される評価フレームワークである。
我々は、最先端のプロプライエタリモデルと微調整モデルSWE-Llamaの両方が、最も単純な問題だけを解決できることを示します。
論文 参考訳(メタデータ) (2023-10-10T16:47:29Z) - How Do Java Developers Reuse StackOverflow Answers in Their GitHub Projects? [5.064338135936606]
StackOverflow (SO)は、ソフトウェア開発者およびコンピュータ科学者のための広く使われているQ&A(Q&A)ウェブサイトである。
GitHubは、ソフトウェアプロジェクトの保存、追跡、コラボレーションに使用されるオンライン開発プラットフォームである。
私たちは、GitHubで利用可能なJavaプロジェクトで再利用されたSOの回答をマイニングして、実証的研究を行いました。
論文 参考訳(メタデータ) (2023-08-18T14:04:59Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - The GitHub Development Workflow Automation Ecosystems [47.818229204130596]
大規模なソフトウェア開発は、非常に協力的な取り組みになっています。
この章では、開発ボットとGitHub Actionsのエコシステムについて解説する。
この領域における最先端技術に関する広範な調査を提供する。
論文 参考訳(メタデータ) (2023-05-08T15:24:23Z) - GitHub Discussions: An Exploratory Study of Early Adoption [23.844242004415406]
私たちは2020年1月から7月にかけて、GitHubの議論を早期に取り入れた混合メソッド調査を実施しました。
1) エラー,予期せぬ動作,コードレビューが議論の代表的なカテゴリであること,(2) プロジェクトメンバの関与と議論頻度との間には肯定的な関係があること,(3) 開発者はGitHubの議論が有用であると考えているが,議論と問題の間のトピック重複の問題に直面している。
私たちの発見は、GitHub Discussionsを使用するためのデータインフォームドガイダンスへの第一歩であり、この新たなコミュニケーションチャネルに関する今後の研究の道を開くものです。
論文 参考訳(メタデータ) (2021-02-10T02:49:03Z) - A Transfer Learning Approach for Dialogue Act Classification of GitHub
Issue Comments [1.370633147306388]
本稿では,GitHub上の課題コメントに基づいて対話行為分類を行うための伝達学習手法を提案する。
GitHubイシューコメントのラベル付きコーパスは存在しないため、転送学習を利用することで、標準的な対話行動データセットを活用することができます。
問題コメントを対話行動にマッピングできることは、認知チームのプロセスを理解するための有用な一歩です。
論文 参考訳(メタデータ) (2020-11-10T02:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。