論文の概要: Leveraging multi-task learning to improve the detection of SATD and vulnerability
- arxiv url: http://arxiv.org/abs/2501.15934v1
- Date: Mon, 27 Jan 2025 10:31:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:58:26.875502
- Title: Leveraging multi-task learning to improve the detection of SATD and vulnerability
- Title(参考訳): SATDと脆弱性の検出を改善するマルチタスク学習の活用
- Authors: Barbara Russo, Jorge Melegati, Moritz Mock,
- Abstract要約: Self-Admitted Technical Debt (SATD) は、短期的なニーズのために導入された、不公平でないコードを示すコード内のコメントである。
VulSATDは、CodeBERTに基づいた脆弱性とSATDコードを検出するディープラーニングである。
- 参考スコア(独自算出の注目度): 2.5385600700122737
- License:
- Abstract: Multi-task learning is a paradigm that leverages information from related tasks to improve the performance of machine learning. Self-Admitted Technical Debt (SATD) are comments in the code that indicate not-quite-right code introduced for short-term needs, i.e., technical debt (TD). Previous research has provided evidence of a possible relationship between SATD and the existence of vulnerabilities in the code. In this work, we investigate if multi-task learning could leverage the information shared between SATD and vulnerabilities to improve the automatic detection of these issues. To this aim, we implemented VulSATD, a deep learner that detects vulnerable and SATD code based on CodeBERT, a pre-trained transformers model. We evaluated VulSATD on MADE-WIC, a fused dataset of functions annotated for TD (through SATD) and vulnerability. We compared the results using single and multi-task approaches, obtaining no significant differences even after employing a weighted loss. Our findings indicate the need for further investigation into the relationship between these two aspects of low-quality code. Specifically, it is possible that only a subset of technical debt is directly associated with security concerns. Therefore, the relationship between different types of technical debt and software vulnerabilities deserves future exploration and a deeper understanding.
- Abstract(参考訳): マルチタスク学習は、関連するタスクの情報を活用して機械学習のパフォーマンスを向上させるパラダイムである。
自己承認技術的負債(英: Self-Admitted Technical Debt、SATD)は、短期的ニーズ、すなわち技術的負債(TD)のために導入された、不公平でないコードを示すコード中のコメントである。
これまでの研究は、SATDとコードに脆弱性が存在する可能性の証拠を提供してきた。
本研究では、SATDと脆弱性間で共有される情報をマルチタスク学習が活用し、これらの問題を自動的に検出できるかどうかを検討する。
そこで我々は,事前学習したトランスフォーマーモデルであるCodeBERTに基づいて,脆弱性およびSATDコードを検出する深層学習システムであるVulSATDを実装した。
我々は,TD (SATD) と脆弱性を付加した関数の融合データセットである MADE-WIC 上で VulSATD を評価した。
その結果,重み付き損失を用いた場合においても有意差は認められなかった。
その結果,これらの低品質コードの2つの側面の関係について,さらなる調査の必要性が示唆された。
具体的には、技術的負債のサブセットのみが、セキュリティ上の懸念に直接関連している可能性がある。
したがって、異なるタイプの技術的負債とソフトウェア脆弱性の関係は、将来の調査とより深い理解に値する。
関連論文リスト
- Evidence is All We Need: Do Self-Admitted Technical Debts Impact Method-Level Maintenance? [1.0377683220196874]
Self-Admitted Technical Debt (SATD)は、開発者がソースコードのコメントを通じて技術的負債を明示的に認める現象である。
本稿では,SATDがソフトウェア保守の様々な面に与える影響を,方法論レベルで実証的に検討することを目的とする。
論文 参考訳(メタデータ) (2024-11-21T01:21:35Z) - Improving the detection of technical debt in Java source code with an enriched dataset [12.07607688189035]
技術的負債(Technical debt, TD)とは、開発者が問題に対して迅速かつ簡単なソリューションを選択すると、追加の作業とコストが発生すること。
近年の研究では、ソースコードに埋め込まれたコメントを分析することで、SATD(Self-Admitted Technical Debts)の検出に焦点が当てられている。
コードコメントによって識別された最初のTDデータセットを、関連するソースコードとともにキュレートしました。
論文 参考訳(メタデータ) (2024-11-08T10:12:33Z) - Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - Security Vulnerability Detection with Multitask Self-Instructed Fine-Tuning of Large Language Models [8.167614500821223]
脆弱性検出のためのMSIVD, マルチタスクによる自己指示型微調整を, チェーン・オブ・シント・プロンプトとLDMによる自己指示にインスパイアした。
実験の結果,MSIVDは高い性能を示し,LineVul(LLMベースの脆弱性検出ベースライン)はBigVulデータセットでは0.92点,PreciseBugsデータセットでは0.48点であった。
論文 参考訳(メタデータ) (2024-06-09T19:18:05Z) - Utilization of machine learning for the detection of self-admitted
vulnerabilities [0.0]
技術的負債(Technical debt)とは、短期的なニーズのために導入された、不公平なコードを記述するメタファーである。
開発者はそれを意識し、ソースコードのコメントで認めている。
論文 参考訳(メタデータ) (2023-09-27T12:38:12Z) - Multitask Learning with No Regret: from Improved Confidence Bounds to
Active Learning [79.07658065326592]
推定タスクの不確実性の定量化は、オンラインやアクティブな学習など、多くの下流アプリケーションにとって重要な課題である。
タスク間の類似性やタスクの特徴を学習者に提供できない場合、課題設定において新しいマルチタスク信頼区間を提供する。
本稿では,このパラメータを事前に知らないまま,このような改善された後悔を実現する新しいオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-03T13:08:09Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - VulBERTa: Simplified Source Code Pre-Training for Vulnerability
Detection [1.256413718364189]
VulBERTaは、ソースコードのセキュリティ脆弱性を検出するためのディープラーニングアプローチである。
当社のアプローチでは,オープンソースのC/C++プロジェクトの実世界のコードに対して,独自のトークン化パイプラインを備えたRoBERTaモデルを事前トレーニングする。
複数のデータセットにまたがるバイナリおよびマルチクラス脆弱性検出タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2022-05-25T00:56:43Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。