論文の概要: A Transfer Learning Approach for Dialogue Act Classification of GitHub
Issue Comments
- arxiv url: http://arxiv.org/abs/2011.04867v1
- Date: Tue, 10 Nov 2020 02:56:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 07:49:23.864207
- Title: A Transfer Learning Approach for Dialogue Act Classification of GitHub
Issue Comments
- Title(参考訳): GitHubイシューコメントの対話行為分類のための伝達学習アプローチ
- Authors: Ayesha Enayet and Gita Sukthankar
- Abstract要約: 本稿では,GitHub上の課題コメントに基づいて対話行為分類を行うための伝達学習手法を提案する。
GitHubイシューコメントのラベル付きコーパスは存在しないため、転送学習を利用することで、標準的な対話行動データセットを活用することができます。
問題コメントを対話行動にマッピングできることは、認知チームのプロセスを理解するための有用な一歩です。
- 参考スコア(独自算出の注目度): 1.370633147306388
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social coding platforms, such as GitHub, serve as laboratories for studying
collaborative problem solving in open source software development; a key
feature is their ability to support issue reporting which is used by teams to
discuss tasks and ideas. Analyzing the dialogue between team members, as
expressed in issue comments, can yield important insights about the performance
of virtual teams. This paper presents a transfer learning approach for
performing dialogue act classification on issue comments. Since no large
labeled corpus of GitHub issue comments exists, employing transfer learning
enables us to leverage standard dialogue act datasets in combination with our
own GitHub comment dataset. We compare the performance of several word and
sentence level encoding models including Global Vectors for Word
Representations (GloVe), Universal Sentence Encoder (USE), and Bidirectional
Encoder Representations from Transformers (BERT). Being able to map the issue
comments to dialogue acts is a useful stepping stone towards understanding
cognitive team processes.
- Abstract(参考訳): githubのようなソーシャルコーディングプラットフォームは、オープンソースソフトウェア開発における協調的な問題解決を研究するための実験室として機能している。
チームメンバー間の対話を分析することで、仮想チームのパフォーマンスに関する重要な洞察を得ることができる。
本稿では,論文コメントの対話行為分類を行うためのトランスファー学習手法を提案する。
GitHubイシューコメントのラベル付きコーパスは存在しないため、転送学習を利用することで、標準的な対話行動データセットとGitHubコメントデータセットを併用することが可能になります。
本稿では,Global Vectors for Word Representations (GloVe), Universal Sentence Encoder (USE), Bidirectional Encoder Representations from Transformers (BERT)など,複数の単語および文レベルの符号化モデルの性能を比較した。
問題コメントを対話行動にマッピングできることは、認知チームのプロセスを理解するための有用な一歩です。
関連論文リスト
- Visual Analysis of GitHub Issues to Gain Insights [2.9051263101214566]
本稿では,課題タイムラインに関する洞察を提供するために,可視化を生成するプロトタイプWebアプリケーションを提案する。
問題のライフサイクルに焦点をあて、ユーザによる開発パターンの理解を高めるために重要な情報を記述する。
論文 参考訳(メタデータ) (2024-07-30T15:17:57Z) - SWE-bench: Can Language Models Resolve Real-World GitHub Issues? [80.52201658231895]
SWE-benchは、実際のGitHub問題から引き出された2,294ドルのソフトウェアエンジニアリング問題と、人気のあるPythonリポジトリ12ドルのプルリクエストで構成される評価フレームワークである。
我々は、最先端のプロプライエタリモデルと微調整モデルSWE-Llamaの両方が、最も単純な問題だけを解決できることを示します。
論文 参考訳(メタデータ) (2023-10-10T16:47:29Z) - InterCode: Standardizing and Benchmarking Interactive Coding with
Execution Feedback [50.725076393314964]
標準的な強化学習環境として,インタラクティブコーディングの軽量でフレキシブルで使いやすいフレームワークであるInterCodeを紹介した。
私たちのフレームワークは、言語とプラットフォームに依存しない、自己完結型のDocker環境を使用して、安全で再現可能な実行を提供します。
我々は、異なるプロンプト戦略で構成された複数の最先端LLMを評価することにより、InterCodeの生存性をテストベッドとして示す。
論文 参考訳(メタデータ) (2023-06-26T17:59:50Z) - SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。
我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。
また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文 参考訳(メタデータ) (2023-05-15T06:08:01Z) - SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for
Task-Oriented Dialog Understanding [68.94808536012371]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから対話表現を学習する,木構造付き事前学習会話モデルを提案する。
提案手法は,7つのデータセットと4つの一般的な対話理解タスクからなるDialoGLUEベンチマークにおいて,最新の結果が得られる。
論文 参考訳(メタデータ) (2022-09-14T13:42:50Z) - Looking for related discussions on GitHub Discussions [18.688096673390586]
GitHub Discussionsは、プラットフォーム上にホストされているユーザとコミュニティのメンバー間の共同ディスカッションを促進するための、ネイティブフォーラムである。
GitHub DiscussionsはPCQAフォーラムに似ているが、このような環境が直面しているのと同じような課題に直面している。
重複した投稿は、同じコンテンツ(そして正確なコピーかもしれない)を持っているが、ほぼ重複して、同様のトピックや情報を共有する。
本稿では,Sentence-BERT事前学習モデル,RD-Detectorに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2022-06-23T20:41:33Z) - CoAuthor: Designing a Human-AI Collaborative Writing Dataset for
Exploring Language Model Capabilities [92.79451009324268]
我々は,GPT-3の創造的かつ議論的な記述を支援する能力を明らかにするために設計されたデータセットであるCoAuthorを提案する。
我々は、CoAuthorがGPT-3の言語、アイデア、コラボレーション機能に関する問題に対処できることを実証した。
インタラクション設計に関して,この作業がLMの約束や落とし穴に関して,より原則化された議論を促進する可能性について論じる。
論文 参考訳(メタデータ) (2022-01-18T07:51:57Z) - Predicting Issue Types on GitHub [8.791809365994682]
Ticket Taggerは、機械学習技術による課題のタイトルと説明を分析するGitHubアプリである。
私たちは、約30,000のGitHubイシューに対して、ツールの予測パフォーマンスを実証的に評価しました。
論文 参考訳(メタデータ) (2021-07-21T08:14:48Z) - Reasoning in Dialog: Improving Response Generation by Context Reading
Comprehension [49.92173751203827]
マルチターンダイアログでは、発話が文の完全な形を取るとは限らない。
読み解きの質問に答えるモデルの能力を検討し、応答生成性能の向上を提案する。
論文 参考訳(メタデータ) (2020-12-14T10:58:01Z) - Multi-turn Response Selection using Dialogue Dependency Relations [39.99448321736736]
マルチターン応答選択は対話エージェントを開発するために設計されたタスクである。
本稿では,対話履歴を依存関係に基づいてスレッドに変換する対話抽出アルゴリズムを提案する。
我々のモデルは、D7とDSTC8*の両方で最先端のベースラインを上回り、Ubuntu上での競合的な結果です。
論文 参考訳(メタデータ) (2020-10-04T08:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。