論文の概要: S3M: Siamese Stack (Trace) Similarity Measure
- arxiv url: http://arxiv.org/abs/2103.10526v1
- Date: Thu, 18 Mar 2021 21:10:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 21:53:44.576312
- Title: S3M: Siamese Stack (Trace) Similarity Measure
- Title(参考訳): s3m: siamese stack (trace) similarity measure
- Authors: Aleksandr Khvorov, Roman Vasiliev, George Chernishev, Irving Muller
Rodrigues, Dmitrij Koznov, Nikita Povarov
- Abstract要約: 本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
- 参考スコア(独自算出の注目度): 55.58269472099399
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic crash reporting systems have become a de-facto standard in software
development. These systems monitor target software, and if a crash occurs they
send details to a backend application. Later on, these reports are aggregated
and used in the development process to 1) understand whether it is a new or an
existing issue, 2) assign these bugs to appropriate developers, and 3) gain a
general overview of the application's bug landscape. The efficiency of report
aggregation and subsequent operations heavily depends on the quality of the
report similarity metric. However, a distinctive feature of this kind of report
is that no textual input from the user (i.e., bug description) is available: it
contains only stack trace information.
In this paper, we present S3M ("extreme") -- the first approach to computing
stack trace similarity based on deep learning. It is based on a siamese
architecture that uses a biLSTM encoder and a fully-connected classifier to
compute similarity. Our experiments demonstrate the superiority of our approach
over the state-of-the-art on both open-sourced data and a private JetBrains
dataset. Additionally, we review the impact of stack trace trimming on the
quality of the results.
- Abstract(参考訳): 自動クラッシュレポートシステムは、ソフトウェア開発におけるデファクトスタンダードになっている。
これらのシステムはターゲットソフトウェアを監視し、クラッシュが発生した場合、詳細をバックエンドアプリケーションに送る。
その後、これらのレポートは開発プロセスで集約され、1)それが新しい問題なのか既存の問題なのかを理解し、2)これらのバグを適切な開発者に割り当て、3)アプリケーションのバグ状況の概観を得る。
レポート集計とその後の運用の効率は、レポート類似度指標の品質に大きく依存する。
しかしながら、この種のレポートの特徴は、ユーザからのテキスト入力(すなわちバグ記述)が利用できないことだ。
本稿では,深層学習に基づくスタックトレース類似性を計算するための最初のアプローチであるS3M(extreme)を提案する。
BiLSTMエンコーダと完全接続型分類器を用いて類似性を計算したシアムアーキテクチャに基づいている。
我々の実験は、オープンソースデータとプライベートJetBrainsデータセットの両方における最先端のアプローチよりも、私たちのアプローチの方が優れていることを示す。
さらに,スタックトレーストリミングが結果の品質に与える影響についても検討する。
関連論文リスト
- EMBERSim: A Large-Scale Databank for Boosting Similarity Search in
Malware Analysis [48.5877840394508]
近年,定量化によるマルウェア検出から機械学習への移行が進んでいる。
本稿では、EMBERから始まるバイナリファイルの類似性研究の領域における欠陥に対処することを提案する。
我々は、EMBERに類似情報とマルウェアのクラスタグを付与し、類似性空間のさらなる研究を可能にする。
論文 参考訳(メタデータ) (2023-10-03T06:58:45Z) - MaintainoMATE: A GitHub App for Intelligent Automation of Maintenance
Activities [3.2228025627337864]
ソフトウェア開発プロジェクトは、バグ報告や強化要求といったメンテナンスタスクの追跡の中心にある問題追跡システムに依存している。
問題レポートの処理は極めて重要であり、問題レポートに入力されたテキストを徹底的にスキャンする必要があるため、労働集約的な作業となる。
各カテゴリのイシューレポートを自動的に分類し,関連する専門知識を持つ開発者にイシューレポートを割り当てることのできる,MaintainoMATEという統合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-31T05:15:42Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Auto-labelling of Bug Report using Natural Language Processing [0.0]
ルールとクエリベースのソリューションは、明確なランキングのない、潜在的な類似バグレポートの長いリストを推奨します。
本論文では,NLP手法の組み合わせによる解を提案する。
カスタムデータトランスフォーマー、ディープニューラルネットワーク、および非汎用機械学習メソッドを使用して、既存の同一バグレポートを検索する。
論文 参考訳(メタデータ) (2022-12-13T02:32:42Z) - Automatic Classification of Bug Reports Based on Multiple Text
Information and Reports' Intention [37.67372105858311]
本稿では,バグレポートの自動分類手法を提案する。
イノベーションは、バグレポートを分類する際に、レポートのテキスト情報に加えて、レポートの意図も考慮することである。
提案手法は性能が向上し,F-Measureは87.3%から95.5%に向上した。
論文 参考訳(メタデータ) (2022-08-02T06:44:51Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - Leveraging Structural Properties of Source Code Graphs for Just-In-Time
Bug Prediction [6.467090475885797]
グラフは関係データを理解するのに最もよく使われる表現の1つである。
本研究では,ソースコードのリレーショナル特性をグラフ形式で活用する手法を提案する。
論文 参考訳(メタデータ) (2022-01-25T07:20:47Z) - DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文 参考訳(メタデータ) (2022-01-14T00:16:57Z) - Learning Dynamic Compact Memory Embedding for Deformable Visual Object
Tracking [82.34356879078955]
本稿では,セグメント化に基づく変形可能な視覚追跡手法の識別を強化するために,コンパクトなメモリ埋め込みを提案する。
DAVIS 2017ベンチマークでは,D3SやSiamMaskなどのセグメンテーションベースのトラッカーよりも優れている。
論文 参考訳(メタデータ) (2021-11-23T03:07:12Z) - Mining Knowledge Graphs From Incident Reports [3.3395585414528663]
顧客から提出されたインシデント報告は、診断や緩和が簡単でないとほとんど構造化されていない。
我々は、共起エンティティペアからバイナリエンティティ関係を抽出し、スコアするアプローチを提案する。
知識グラフを自動的に構築し、グラフ内の暗黙の知識が、異なるインシデントに対する関連エンティティのランク付けに使用できることを示す。
論文 参考訳(メタデータ) (2021-01-15T04:15:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。