論文の概要: S3M: Siamese Stack (Trace) Similarity Measure
- arxiv url: http://arxiv.org/abs/2103.10526v1
- Date: Thu, 18 Mar 2021 21:10:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 21:53:44.576312
- Title: S3M: Siamese Stack (Trace) Similarity Measure
- Title(参考訳): s3m: siamese stack (trace) similarity measure
- Authors: Aleksandr Khvorov, Roman Vasiliev, George Chernishev, Irving Muller
Rodrigues, Dmitrij Koznov, Nikita Povarov
- Abstract要約: 本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
- 参考スコア(独自算出の注目度): 55.58269472099399
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic crash reporting systems have become a de-facto standard in software
development. These systems monitor target software, and if a crash occurs they
send details to a backend application. Later on, these reports are aggregated
and used in the development process to 1) understand whether it is a new or an
existing issue, 2) assign these bugs to appropriate developers, and 3) gain a
general overview of the application's bug landscape. The efficiency of report
aggregation and subsequent operations heavily depends on the quality of the
report similarity metric. However, a distinctive feature of this kind of report
is that no textual input from the user (i.e., bug description) is available: it
contains only stack trace information.
In this paper, we present S3M ("extreme") -- the first approach to computing
stack trace similarity based on deep learning. It is based on a siamese
architecture that uses a biLSTM encoder and a fully-connected classifier to
compute similarity. Our experiments demonstrate the superiority of our approach
over the state-of-the-art on both open-sourced data and a private JetBrains
dataset. Additionally, we review the impact of stack trace trimming on the
quality of the results.
- Abstract(参考訳): 自動クラッシュレポートシステムは、ソフトウェア開発におけるデファクトスタンダードになっている。
これらのシステムはターゲットソフトウェアを監視し、クラッシュが発生した場合、詳細をバックエンドアプリケーションに送る。
その後、これらのレポートは開発プロセスで集約され、1)それが新しい問題なのか既存の問題なのかを理解し、2)これらのバグを適切な開発者に割り当て、3)アプリケーションのバグ状況の概観を得る。
レポート集計とその後の運用の効率は、レポート類似度指標の品質に大きく依存する。
しかしながら、この種のレポートの特徴は、ユーザからのテキスト入力(すなわちバグ記述)が利用できないことだ。
本稿では,深層学習に基づくスタックトレース類似性を計算するための最初のアプローチであるS3M(extreme)を提案する。
BiLSTMエンコーダと完全接続型分類器を用いて類似性を計算したシアムアーキテクチャに基づいている。
我々の実験は、オープンソースデータとプライベートJetBrainsデータセットの両方における最先端のアプローチよりも、私たちのアプローチの方が優れていることを示す。
さらに,スタックトレーストリミングが結果の品質に与える影響についても検討する。
関連論文リスト
- Towards Realistic Evaluation of Commit Message Generation by Matching Online and Offline Settings [77.20838441870151]
コミットメッセージ生成は、ソフトウェアエンジニアリングにおいて重要なタスクであり、正しく評価することが難しい。
オンラインメトリック - VCSに生成されたメッセージをコミットする前にユーザが導入する編集回数 - を使用して、オフライン実験用のメトリクスを選択します。
その結果,編集距離が最も高い相関を示すのに対し,BLEUやMETEORなどの類似度は低い相関を示すことがわかった。
論文 参考訳(メタデータ) (2024-10-15T20:32:07Z) - Multi-View Adaptive Contrastive Learning for Information Retrieval Based Fault Localization [5.1987901165589]
MACL-IRFL(Multi-View Adaptive Contrastive Learning for Information Retrieval Fault Localization)という新しい手法を提案する。
まず、レポート・コード・インタラクション・ビュー、レポート・レポートの類似性ビュー、コード・コードの共引用ビューを別々に生成し、グラフニューラルネットワークを用いて、埋め込みプロセスの3つのビューからバグレポートやソースコードファイルの情報を集約する。
コントラスト学習タスクの設計では,バグレポートの表現は,レポートレポートやレポートコードビューで共有される情報をエンコードし,ソースコードファイルの表現はコードコードとレポートコードビューで共有する。
論文 参考訳(メタデータ) (2024-09-19T07:20:10Z) - SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.079013202051094]
ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。
このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文 参考訳(メタデータ) (2024-07-03T15:30:45Z) - Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - EMBERSim: A Large-Scale Databank for Boosting Similarity Search in
Malware Analysis [48.5877840394508]
近年,定量化によるマルウェア検出から機械学習への移行が進んでいる。
本稿では、EMBERから始まるバイナリファイルの類似性研究の領域における欠陥に対処することを提案する。
我々は、EMBERに類似情報とマルウェアのクラスタグを付与し、類似性空間のさらなる研究を可能にする。
論文 参考訳(メタデータ) (2023-10-03T06:58:45Z) - MaintainoMATE: A GitHub App for Intelligent Automation of Maintenance
Activities [3.2228025627337864]
ソフトウェア開発プロジェクトは、バグ報告や強化要求といったメンテナンスタスクの追跡の中心にある問題追跡システムに依存している。
問題レポートの処理は極めて重要であり、問題レポートに入力されたテキストを徹底的にスキャンする必要があるため、労働集約的な作業となる。
各カテゴリのイシューレポートを自動的に分類し,関連する専門知識を持つ開発者にイシューレポートを割り当てることのできる,MaintainoMATEという統合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-31T05:15:42Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Auto-labelling of Bug Report using Natural Language Processing [0.0]
ルールとクエリベースのソリューションは、明確なランキングのない、潜在的な類似バグレポートの長いリストを推奨します。
本論文では,NLP手法の組み合わせによる解を提案する。
カスタムデータトランスフォーマー、ディープニューラルネットワーク、および非汎用機械学習メソッドを使用して、既存の同一バグレポートを検索する。
論文 参考訳(メタデータ) (2022-12-13T02:32:42Z) - Automatic Classification of Bug Reports Based on Multiple Text
Information and Reports' Intention [37.67372105858311]
本稿では,バグレポートの自動分類手法を提案する。
イノベーションは、バグレポートを分類する際に、レポートのテキスト情報に加えて、レポートの意図も考慮することである。
提案手法は性能が向上し,F-Measureは87.3%から95.5%に向上した。
論文 参考訳(メタデータ) (2022-08-02T06:44:51Z) - Leveraging Structural Properties of Source Code Graphs for Just-In-Time
Bug Prediction [6.467090475885797]
グラフは関係データを理解するのに最もよく使われる表現の1つである。
本研究では,ソースコードのリレーショナル特性をグラフ形式で活用する手法を提案する。
論文 参考訳(メタデータ) (2022-01-25T07:20:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。