論文の概要: Is Surprisal in Issue Trackers Actionable?
- arxiv url: http://arxiv.org/abs/2204.07363v1
- Date: Fri, 15 Apr 2022 07:49:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 21:06:06.892568
- Title: Is Surprisal in Issue Trackers Actionable?
- Title(参考訳): 問題追跡におけるsurprisalは有効か?
- Authors: James Caddy, Markus Wagner, Christoph Treude, Earl T. Barr, Miltiadis
Allamanis
- Abstract要約: 本稿では,ソフトウェアリポジトリにおける異常事象検出手法を提案する。
GitHubで最も人気のあるソフトウェアリポジトリ5,000からイシューとプルリクエストを抽出します。
リポジトリにおけるそれらの重要性を計測し、いくつかのアナログを用いてその解決の難しさを計測し、それぞれの素因を計測し、最終的に推論統計を生成する。
- 参考スコア(独自算出の注目度): 27.027874108736828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background. From information theory, surprisal is a measurement of how
unexpected an event is. Statistical language models provide a probabilistic
approximation of natural languages, and because surprisal is constructed with
the probability of an event occuring, it is therefore possible to determine the
surprisal associated with English sentences. The issues and pull requests of
software repository issue trackers give insight into the development process
and likely contain the surprising events of this process.
Objective. Prior works have identified that unusual events in software
repositories are of interest to developers, and use simple code metrics-based
methods for detecting them. In this study we will propose a new method for
unusual event detection in software repositories using surprisal. With the
ability to find surprising issues and pull requests, we intend to further
analyse them to determine if they actually hold importance in a repository, or
if they pose a significant challenge to address. If it is possible to find bad
surprises early, or before they cause additional troubles, it is plausible that
effort, cost and time will be saved as a result.
Method. After extracting the issues and pull requests from 5000 of the most
popular software repositories on GitHub, we will train a language model to
represent these issues. We will measure their perceived importance in the
repository, measure their resolution difficulty using several analogues,
measure the surprisal of each, and finally generate inferential statistics to
describe any correlations.
- Abstract(参考訳): 背景。
情報理論では、仮定とは、ある事象がどれだけ予期しないかを測るものである。
統計的言語モデルは、自然言語の確率論的近似を提供し、確率は事象が起こる確率で構成されるため、英文に関連する確率を決定することが可能である。
ソフトウェアリポジトリのイシュートラッカのイシューとプルリクエストは、開発プロセスに関する洞察を与え、このプロセスの驚くべきイベントを含む可能性が高い。
目的。
以前の作業では、ソフトウェアリポジトリの異常なイベントは開発者にとって関心のあるものであり、単純なコードメトリクスベースのメソッドを使って検出している。
本研究では,surprisalを用いたソフトウェアリポジトリにおける異常事象検出手法を提案する。
驚くべき問題を見つけ、リクエストをプルする能力によって、リポジトリで実際に重要であるかどうか、あるいは対処すべき重要な課題に対処するかどうかを、さらに分析して判断するつもりです。
早い段階で、あるいは追加のトラブルを引き起こす前に、悪いサプライズを見つけることができれば、結果として労力、コスト、時間が節約される可能性は高い。
方法。
GitHub上で最も人気のあるソフトウェアリポジトリ5,000から問題とプルリクエストを抽出した後、これらの問題を表現するために言語モデルをトレーニングします。
我々は,レポジトリにおけるそれらの重要性を計測し,いくつかのアナログを用いてその解決の難しさを測定し,それぞれの素因を計測し,最後に相関関係を記述するための推論統計を生成する。
関連論文リスト
- Can Language Beat Numerical Regression? Language-Based Multimodal Trajectory Prediction [23.45902601618188]
言語モデルは、文脈理解と生成性能において印象的な能力を示してきた。
LMTraj (Language-based Multimodal Trajectory predictor) を提案する。
本稿では,言語に基づくモデルが,歩行者の軌道予測に有効なことを示し,既存の数値ベースの予測手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-27T11:06:44Z) - Toward the Automated Construction of Probabilistic Knowledge Graphs for
the Maritime Domain [60.76554773885988]
国際海事犯罪はますます高度化しており、より広い犯罪ネットワークと結びついていることが多い。
これは、ハードデータと他のタイプのデータを組み合わせることを目的とした研究と開発に繋がった。
本稿では,確率的知識グラフの自動構築のためのプロトタイプであるMaritime DeepDiveを提案する。
論文 参考訳(メタデータ) (2023-05-04T00:24:30Z) - Detecting Requirements Smells With Deep Learning: Experiences,
Challenges and Future Work [9.44316959798363]
本研究の目的は,手動でラベル付きデータセットを作成し,アンサンブル学習,深層学習(DL),単語埋め込みや伝達学習といった手法を用いて一般化問題を克服することで,従来の作業を改善することである。
現在の調査結果は、データセットが不均衡であり、どのクラスをもっと追加すべきかを示している。
論文 参考訳(メタデータ) (2021-08-06T12:45:15Z) - Predicting the Number of Reported Bugs in a Software Repository [0.0]
本研究では,Long Short Term Memory Neural Networks (LSTM), Auto-Regressive Integrated moving average (ARIMA), Random Forest Regressorの8種類の時系列予測モデルについて検討した。
異なる性能指標に基づいて、各モデルの長期予測の品質を分析します。
評価は、大規模なオープンソースソフトウェアアプリケーションであるMozilla上で行われる。
論文 参考訳(メタデータ) (2021-04-24T19:06:35Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Recomposition vs. Prediction: A Novel Anomaly Detection for Discrete
Events Based On Autoencoder [5.781280693720236]
侵入検知の分野で最も難しい問題の1つは、離散イベントログの異常検出である。
離散イベントログのDeep Autoencoderベースの異常検出手法であるDabLogを提案する。
解析(符号化)と再構成(復号化)により、シーケンスが正常または異常かどうかを判定します。
論文 参考訳(メタデータ) (2020-12-27T16:31:05Z) - Exploring Bayesian Surprise to Prevent Overfitting and to Predict Model
Performance in Non-Intrusive Load Monitoring [25.32973996508579]
非侵入負荷モニタリング(Non-Intrusive Load Monitoring, NILM)は、集積信号のみに基づくシステムにおける構成的電気負荷の分離に焦点を当てた研究分野である。
予測分布(予測的サプライズ)と遷移確率(遷移的サプライズ)の間のサプライズ度を定量化する。
この研究は、データセットサイズに関するモデルパフォーマンスのリターンを減少させるポイントが存在するという明確な証拠を提供する。
論文 参考訳(メタデータ) (2020-09-16T15:39:08Z) - Information-Theoretic Probing for Linguistic Structure [74.04862204427944]
本稿では,相互情報を推定するための情報理論による探索運用手法を提案する。
我々は,NLP研究でしばしば不足している10の型的多様言語について評価した。
論文 参考訳(メタデータ) (2020-04-07T01:06:36Z) - Probabilistic Regression for Visual Tracking [193.05958682821444]
本稿では,確率論的回帰定式化を提案し,追跡に適用する。
入力画像が与えられたターゲット状態の条件付き確率密度を予測する。
トラッカーは6つのデータセットに新しい最先端のデータをセットし、LaSOTでは59.8%、TrackingNetでは75.8%のAUCを達成した。
論文 参考訳(メタデータ) (2020-03-27T17:58:37Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z) - Parameter Space Factorization for Zero-Shot Learning across Tasks and
Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。
タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。
我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文 参考訳(メタデータ) (2020-01-30T16:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。