Fugu-MT 論文翻訳(概要): Stack Trace Deduplication: Faster, More Accurately, and in More Realistic Scenarios

論文の概要: Stack Trace Deduplication: Faster, More Accurately, and in More Realistic Scenarios

arxiv url: http://arxiv.org/abs/2412.14802v1
Date: Thu, 19 Dec 2024 12:48:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-20 18:44:16.125375
Title: Stack Trace Deduplication: Faster, More Accurately, and in More Realistic Scenarios
Title（参考訳）: スタックトレースの重複 - より速く、より正確に、より現実的なシナリオで
Authors: Egor Shibaev, Denis Sushentsev, Yaroslav Golubev, Aleksandr Khvorov,
Abstract要約: 大規模なソフトウェアシステムでは、エラーが発生した時に人による記述が書かれた完全なバグレポートは存在しないことが多い。この場合、開発者はスタックトレース、すなわち一連の関数呼び出しに頼り、エラーを引き起こした。近年の研究では、これに対する強力な深層学習に基づくアプローチが提案されているが、実際のカテゴリーから独立して評価され、比較されている。
参考スコア（独自算出の注目度）: 42.75968139336785
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In large-scale software systems, there are often no fully-fledged bug reports with human-written descriptions when an error occurs. In this case, developers rely on stack traces, i.e., series of function calls that led to the error. Since there can be tens and hundreds of thousands of them describing the same issue from different users, automatic deduplication into categories is necessary to allow for processing. Recent works have proposed powerful deep learning-based approaches for this, but they are evaluated and compared in isolation from real-life workflows, and it is not clear whether they will actually work well at scale. To overcome this gap, this work presents three main contributions: a novel model, an industry-based dataset, and a multi-faceted evaluation. Our model consists of two parts - (1) an embedding model with byte-pair encoding and approximate nearest neighbor search to quickly find the most relevant stack traces to the incoming one, and (2) a reranker that re-ranks the most fitting stack traces, taking into account the repeated frames between them. To complement the existing datasets collected from open-source projects, we share with the community SlowOps - a dataset of stack traces from IntelliJ-based products developed by JetBrains, which has an order of magnitude more stack traces per category. Finally, we carry out an evaluation that strives to be realistic: measuring not only the accuracy of categorization, but also the operation time and the ability to create new categories. The evaluation shows that our model strikes a good balance - it outperforms other models on both open-source datasets and SlowOps, while also being faster on time than most. We release all of our code and data, and hope that our work can pave the way to further practice-oriented research in the area.
Abstract（参考訳）: 大規模なソフトウェアシステムでは、エラーが発生した時に人による記述が書かれた完全なバグレポートは存在しないことが多い。この場合、開発者はスタックトレース、すなわち一連の関数呼び出しに頼り、エラーを引き起こした。数万、数十万のユーザーが同じ問題を異なるユーザから記述できるため、処理を許可するためにはカテゴリへの自動重複が不可欠である。最近の研究は、このために強力なディープラーニングベースのアプローチを提案しているが、それらは実生活のワークフローから独立して評価され、比較されている。このギャップを克服するために、この研究は、新しいモデル、業界ベースのデータセット、多面的評価の3つの主要な貢献を提示する。本モデルでは,(1)バイトペアエンコーディングと近接近傍探索を併用した埋め込みモデルを用いて,最も関連性の高いスタックトレースを素早く発見し,(2)最も適合したスタックトレースを再ランクする再ランカと,それらの間の繰り返しフレームを考慮に入れた2つの部分から構成される。オープンソースプロジェクトから収集された既存のデータセットを補完するため、コミュニティのSlowOps – JetBrainsが開発したIntelliJベースの製品から得られたスタックトレースのデータセット – と共有しています。最後に,分類の精度だけでなく,作業時間や新たなカテゴリを作成する能力も測定し,現実的な評価を試みている。評価の結果、私たちのモデルはバランスが良く、オープンソースデータセットとSlowOpsの両方で他のモデルよりも優れています。すべてのコードとデータをリリースし、この分野におけるさらなる実践指向の研究の道を開いたいと考えています。

関連論文リスト

GPTrace: Effective Crash Deduplication Using LLM Embeddings [0.8166364251367626]
クラッシュ重複(Crash Deduplication)とは、重複するインプットを検出して、検査が必要なデータを減らすタスクである。 GPTraceは,大規模な言語モデルを利用して,クラッシュに伴う各種データソースの類似性を評価するデ重複ワークフローである。 14のターゲットから50の真実ラベルに属する30万以上のクラッシュインプットに対して,我々のアプローチを評価した。
論文参考訳（メタデータ） (2025-12-01T12:30:30Z)
SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文参考訳（メタデータ） (2025-05-29T18:28:02Z)
Optimizing Datasets for Code Summarization: Is Code-Comment Coherence Enough? [11.865113785648932]
コード要約の特定の品質属性であるコード圧縮コヒーレンスが、コードの要約データセットの最適化にどの程度利用できるかを検討する。 2つの最先端データセット(TL-CodeSumとFuncom)から複数のレベルのトレーニングインスタンスを調べ、3つの手作業によるテストセット上で結果モデルを評価する。
論文参考訳（メタデータ） (2025-02-11T15:02:19Z)
Contextualization with SPLADE for High Recall Retrieval [5.973857434357868]
ハイリコール検索(High Recall Retrieval, HRR)は、あるコレクション内の最も関連性の高い文書を検索するコストを最適化する検索問題である。本研究では,文書を文脈化されたスパースベクトルに変換する効率的な検索モデルであるSPLADEを活用する。 2つのHRR評価コレクションのレビューコストの10%と18%を1フェーズのレビューワークフローで削減し、80%のリコールを目標としている。
論文参考訳（メタデータ） (2024-05-07T03:05:37Z)
List-aware Reranking-Truncation Joint Model for Search and Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。 GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文参考訳（メタデータ） (2024-02-05T06:52:53Z)
DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。 4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文参考訳（メタデータ） (2022-10-28T11:18:10Z)
DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文参考訳（メタデータ） (2022-01-14T00:16:57Z)
On the Evaluation of Commit Message Generation Models: An Experimental Study [33.19314967188712]
コミットメッセージは、コード変更の自然言語記述であり、プログラムの理解とメンテナンスに重要である。コミットメッセージを自動的に生成するために, 生成手法や検索手法を利用した様々な手法が提案されている。本稿では,最先端のモデルとデータセットの体系的,詳細な分析を行う。
論文参考訳（メタデータ） (2021-07-12T12:38:02Z)
S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。 BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文参考訳（メタデータ） (2021-03-18T21:10:41Z)
Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。既存のアプローチは、ログ特化や手動ルール抽出に依存している。本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文参考訳（メタデータ） (2020-03-17T19:25:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。