Fugu-MT 論文翻訳(概要): S3M: Siamese Stack (Trace) Similarity Measure

論文の概要: S3M: Siamese Stack (Trace) Similarity Measure

arxiv url: http://arxiv.org/abs/2103.10526v1
Date: Thu, 18 Mar 2021 21:10:41 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-22 21:53:44.576312
Title: S3M: Siamese Stack (Trace) Similarity Measure
Title（参考訳）: s3m: siamese stack (trace) similarity measure
Authors: Aleksandr Khvorov, Roman Vasiliev, George Chernishev, Irving Muller Rodrigues, Dmitrij Koznov, Nikita Povarov
Abstract要約: 本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。 BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
参考スコア（独自算出の注目度）: 55.58269472099399
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automatic crash reporting systems have become a de-facto standard in software development. These systems monitor target software, and if a crash occurs they send details to a backend application. Later on, these reports are aggregated and used in the development process to 1) understand whether it is a new or an existing issue, 2) assign these bugs to appropriate developers, and 3) gain a general overview of the application's bug landscape. The efficiency of report aggregation and subsequent operations heavily depends on the quality of the report similarity metric. However, a distinctive feature of this kind of report is that no textual input from the user (i.e., bug description) is available: it contains only stack trace information. In this paper, we present S3M ("extreme") -- the first approach to computing stack trace similarity based on deep learning. It is based on a siamese architecture that uses a biLSTM encoder and a fully-connected classifier to compute similarity. Our experiments demonstrate the superiority of our approach over the state-of-the-art on both open-sourced data and a private JetBrains dataset. Additionally, we review the impact of stack trace trimming on the quality of the results.
Abstract（参考訳）: 自動クラッシュレポートシステムは、ソフトウェア開発におけるデファクトスタンダードになっている。これらのシステムはターゲットソフトウェアを監視し、クラッシュが発生した場合、詳細をバックエンドアプリケーションに送る。その後、これらのレポートは開発プロセスで集約され、1)それが新しい問題なのか既存の問題なのかを理解し、2)これらのバグを適切な開発者に割り当て、3)アプリケーションのバグ状況の概観を得る。レポート集計とその後の運用の効率は、レポート類似度指標の品質に大きく依存する。しかしながら、この種のレポートの特徴は、ユーザからのテキスト入力(すなわちバグ記述)が利用できないことだ。本稿では,深層学習に基づくスタックトレース類似性を計算するための最初のアプローチであるS3M(extreme)を提案する。 BiLSTMエンコーダと完全接続型分類器を用いて類似性を計算したシアムアーキテクチャに基づいている。我々の実験は、オープンソースデータとプライベートJetBrainsデータセットの両方における最先端のアプローチよりも、私たちのアプローチの方が優れていることを示す。さらに,スタックトレーストリミングが結果の品質に与える影響についても検討する。

関連論文リスト

SysPro: Reproducing System-level Concurrency Bugs from Bug Reports [3.789798997996016]
システムレベルのバグを再現するには、入力データとシステム呼び出しの正確なインターリーブ順序の両方が必要である。既存のツールは、システムコールレベルで特定のインターリーブを管理することができないため、これらのバグを再現するには不十分です。本稿では,バグレポートから関連するシステムコール名を自動抽出し,ソースコード内の位置情報を識別するSysProを提案する。
論文参考訳（メタデータ） (2026-01-14T16:40:08Z)
GPTrace: Effective Crash Deduplication Using LLM Embeddings [0.8166364251367626]
クラッシュ重複(Crash Deduplication)とは、重複するインプットを検出して、検査が必要なデータを減らすタスクである。 GPTraceは,大規模な言語モデルを利用して,クラッシュに伴う各種データソースの類似性を評価するデ重複ワークフローである。 14のターゲットから50の真実ラベルに属する30万以上のクラッシュインプットに対して,我々のアプローチを評価した。
論文参考訳（メタデータ） (2025-12-01T12:30:30Z)
MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文参考訳（メタデータ） (2025-08-13T19:14:48Z)
Rethinking End-to-End 2D to 3D Scene Segmentation in Gaussian Splatting [86.15347226865826]
We design an new end-to-end object-aware lifting approach, called Unified-Lift。コントラスト損失を用いて学習したガウスレベルの機能を各ガウス点に拡張し、インスタンス情報をエンコードする。 LERF-Masked、Replica、Messy Roomsの3つのベンチマークで実験を行った。
論文参考訳（メタデータ） (2025-03-18T08:42:23Z)
An Empirical Study on the Classification of Bug Reports with Machine Learning [1.1499574149885023]
課題報告の分類処理において,異なる要因(プロジェクト言語,報告内容など)がモデルの性能に与える影響について検討する。 Support Vector Machine, Logistic Regression, Random Forestは課題レポートの分類に有効である。不均一なプロジェクトに基づくモデルは、トレーニング中に存在しないプロジェクトからのレポートを分類することができる。
論文参考訳（メタデータ） (2025-03-01T23:19:56Z)
Erasing Without Remembering: Implicit Knowledge Forgetting in Large Language Models [70.78205685001168]
我々は,その一般化に着目して,大規模言語モデルにおける知識の忘れについて検討する。 UGBenchは、スコープ内暗黙の知識の未学習を評価するために特別に設計された最初のベンチマークである。確率に基づく新しいアンラーニングパラダイムであるPerMUを提案する。
論文参考訳（メタデータ） (2025-02-27T11:03:33Z)
Stack Trace Deduplication: Faster, More Accurately, and in More Realistic Scenarios [42.75968139336785]
大規模なソフトウェアシステムでは、エラーが発生した時に人による記述が書かれた完全なバグレポートは存在しないことが多い。この場合、開発者はスタックトレース、すなわち一連の関数呼び出しに頼り、エラーを引き起こした。近年の研究では、これに対する強力な深層学習に基づくアプローチが提案されているが、実際のカテゴリーから独立して評価され、比較されている。
論文参考訳（メタデータ） (2024-12-19T12:48:17Z)
Towards Realistic Evaluation of Commit Message Generation by Matching Online and Offline Settings [77.20838441870151]
コミットメッセージ生成は、ソフトウェアエンジニアリングにおいて重要なタスクであり、正しく評価することが難しい。オンラインメトリック - VCSに生成されたメッセージをコミットする前にユーザが導入する編集回数 - を使用して、オフライン実験用のメトリクスを選択します。その結果,編集距離が最も高い相関を示すのに対し,BLEUやMETEORなどの類似度は低い相関を示すことがわかった。
論文参考訳（メタデータ） (2024-10-15T20:32:07Z)
Multi-View Adaptive Contrastive Learning for Information Retrieval Based Fault Localization [5.1987901165589]
MACL-IRFL(Multi-View Adaptive Contrastive Learning for Information Retrieval Fault Localization)という新しい手法を提案する。まず、レポート・コード・インタラクション・ビュー、レポート・レポートの類似性ビュー、コード・コードの共引用ビューを別々に生成し、グラフニューラルネットワークを用いて、埋め込みプロセスの3つのビューからバグレポートやソースコードファイルの情報を集約する。コントラスト学習タスクの設計では,バグレポートの表現は,レポートレポートやレポートコードビューで共有される情報をエンコードし,ソースコードファイルの表現はコードコードとレポートコードビューで共有する。
論文参考訳（メタデータ） (2024-09-19T07:20:10Z)
SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.079013202051094]
ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文参考訳（メタデータ） (2024-07-03T15:30:45Z)
Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文参考訳（メタデータ） (2024-03-27T15:15:14Z)
EMBERSim: A Large-Scale Databank for Boosting Similarity Search in Malware Analysis [48.5877840394508]
近年,定量化によるマルウェア検出から機械学習への移行が進んでいる。本稿では、EMBERから始まるバイナリファイルの類似性研究の領域における欠陥に対処することを提案する。我々は、EMBERに類似情報とマルウェアのクラスタグを付与し、類似性空間のさらなる研究を可能にする。
論文参考訳（メタデータ） (2023-10-03T06:58:45Z)
MaintainoMATE: A GitHub App for Intelligent Automation of Maintenance Activities [3.2228025627337864]
ソフトウェア開発プロジェクトは、バグ報告や強化要求といったメンテナンスタスクの追跡の中心にある問題追跡システムに依存している。問題レポートの処理は極めて重要であり、問題レポートに入力されたテキストを徹底的にスキャンする必要があるため、労働集約的な作業となる。各カテゴリのイシューレポートを自動的に分類し,関連する専門知識を持つ開発者にイシューレポートを割り当てることのできる,MaintainoMATEという統合フレームワークを提案する。
論文参考訳（メタデータ） (2023-08-31T05:15:42Z)
Modeling Entities as Semantic Points for Visual Information Extraction in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文参考訳（メタデータ） (2023-03-23T08:21:16Z)
Auto-labelling of Bug Report using Natural Language Processing [0.0]
ルールとクエリベースのソリューションは、明確なランキングのない、潜在的な類似バグレポートの長いリストを推奨します。本論文では,NLP手法の組み合わせによる解を提案する。カスタムデータトランスフォーマー、ディープニューラルネットワーク、および非汎用機械学習メソッドを使用して、既存の同一バグレポートを検索する。
論文参考訳（メタデータ） (2022-12-13T02:32:42Z)
Automatic Classification of Bug Reports Based on Multiple Text Information and Reports' Intention [37.67372105858311]
本稿では,バグレポートの自動分類手法を提案する。イノベーションは、バグレポートを分類する際に、レポートのテキスト情報に加えて、レポートの意図も考慮することである。提案手法は性能が向上し,F-Measureは87.3%から95.5%に向上した。
論文参考訳（メタデータ） (2022-08-02T06:44:51Z)
Leveraging Structural Properties of Source Code Graphs for Just-In-Time Bug Prediction [6.467090475885797]
グラフは関係データを理解するのに最もよく使われる表現の1つである。本研究では,ソースコードのリレーショナル特性をグラフ形式で活用する手法を提案する。
論文参考訳（メタデータ） (2022-01-25T07:20:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。