論文の概要: Enhancing Requirements Traceability Link Recovery: A Novel Approach with T-SimCSE
- arxiv url: http://arxiv.org/abs/2603.11800v1
- Date: Thu, 12 Mar 2026 11:02:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.03348
- Title: Enhancing Requirements Traceability Link Recovery: A Novel Approach with T-SimCSE
- Title(参考訳): 要求のトレーサビリティ・リンク・リカバリの強化:T-SimCSEによる新しいアプローチ
- Authors: Ye Wang, Wenqing Wang, Kun Hu, Qiao Huang, Liping Zhao,
- Abstract要約: 本稿では,T-SimCSEと呼ばれる新しい要求トレーサビリティ・リンク・リカバリ手法を提案する。
T-SimCSEはラベル付きデータを必要とせず、幅広い適用性を持ち、性能が良いという利点がある。
我々はT-SimCSEを10の公開データセットで評価し、他のアプローチと比較した。
- 参考スコア(独自算出の注目度): 23.7408455668362
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Requirements traceability plays an important role in ensuring software quality and responding to changes in requirements. Requirements trace links (such as the links between requirements and other software artifacts) underpin the modeling and implementation of requirements traceability. With the rapid development of artificial intelligence, more and more pre-trained language models (PLMs) techniques are applied to the automatic recovery of requirements trace links. However, the requirements traceability links recovered by these approaches are not accurate enough, and many approaches require a large labeled dataset for training. Currently, there are very few labeled datasets available. To address these limitations, this paper proposes a novel requirements traceability link recovery approach called T-SimCSE, which is based on a PLM -- SimCSE. SimCSE has the advantages of not requiring labeled data, having broad applicability, and performing well. T-SimCSE firstly uses the SimCSE model to calculate the similarity between requirements and target artifacts, and employs a new metric (i.e. specificity) to reorder those target artifacts. Finally, the trace links are created between the requirement and the top-K target artifacts. We have evaluated T-SimCSE on ten public datasets by comparing them with other approaches. The results show that T-SimCSE achieves superior performance in terms of recall and Mean Average Precision (MAP).
- Abstract(参考訳): 要求のトレーサビリティは、ソフトウェアの品質を保証し、要求の変化に対応する上で重要な役割を果たす。
要求トレーサビリティのモデリングと実装の基盤となるトレーサビリティリンク(要求と他のソフトウェアアーティファクトのリンクなど)。
人工知能の急速な発展に伴い、要求トレースリンクの自動リカバリにPLM(pre-trained language model)技術が適用されるようになった。
しかし、これらのアプローチによって回収された要求トレーサビリティリンクは十分正確ではなく、多くのアプローチではトレーニングのために大きなラベル付きデータセットを必要とする。
現在、ラベル付きデータセットはごくわずかである。
そこで本研究では,PLM-SimCSEに基づくT-SimCSEと呼ばれる新しい要求トレーサビリティ・リンク・リカバリ手法を提案する。
SimCSEはラベル付きデータを必要とせず、幅広い適用性を持ち、性能が良いという利点がある。
T-SimCSEはまずSimCSEモデルを用いて要求と対象のアーティファクトの類似性を計算する。
最後に、トレーサリンクは、要求とトップKターゲットアーティファクトの間に生成される。
我々はT-SimCSEを10の公開データセットで評価し、他のアプローチと比較した。
その結果,T-SimCSEはリコールや平均精度(MAP)において優れた性能を発揮することがわかった。
関連論文リスト
- TraceLLM: Leveraging Large Language Models with Prompt Engineering for Enhanced Requirements Traceability [4.517933493143603]
本稿では,要求トレーサビリティ向上のためのフレームワークであるTraceLLMを紹介する。
我々は,4つのベンチマークデータセット上で8つの最先端LCMを用いて,迅速な一般化とロバスト性を評価する。
論文 参考訳(メタデータ) (2026-02-01T14:29:13Z) - Knowledge-to-Data: LLM-Driven Synthesis of Structured Network Traffic for Testbed-Free IDS Evaluation [0.4893345190925178]
本稿では,Large Language Models (LLMs) が構造化された合成ネットワークトラフィックデータセットを生成するための制御された知識データエンジンとして機能するかどうかを検討する。
本稿では,プロトコル文書,アタックセマンティクス,および明示的な統計的ルールを組み合わせた手法を提案する。
その結果、明示的な制約の下では、LLM生成データセットは実際のネットワークトラフィックの統計的および構造的特性を正確に近似することができることがわかった。
論文 参考訳(メタデータ) (2026-01-08T15:31:33Z) - VeriSciQA: An Auto-Verified Dataset for Scientific Visual Question Answering [53.662676566188175]
重要なボトルネックは、パブリックで大規模で高品質なビジュアル質問回答(SVQA)データセットの欠如にある。
本稿では、まず、図形関連テクストコンテキストとQAペアを生成する検証中心のGenerate-then-Verifyフレームワークを提案する。
このフレームワークをインスタンス化し、20の科学的ドメインと12のフィギュアタイプからなる20,351のQAペアのデータセットであるVeriSciQAをキュレートします。
論文 参考訳(メタデータ) (2025-11-25T04:14:52Z) - SDQM: Synthetic Data Quality Metric for Object Detection Dataset Evaluation [3.2150327776278576]
本稿では,オブジェクト検出タスクのデータ品質を評価するために,Synthetic dataset Quality Metric (SDQM)を提案する。
実験の結果,SDQMは,主物体検出モデルYOLOv11の平均精度 (mAP) と強い相関を示した。
データセットの品質向上のための実用的な洞察を提供し、コストのかかる反復的なトレーニングの必要性を最小限にする。
論文 参考訳(メタデータ) (2025-10-08T03:01:26Z) - Synergistic Enhancement of Requirement-to-Code Traceability: A Framework Combining Large Language Model based Data Augmentation and an Advanced Encoder [5.241456612683375]
本稿では,大規模言語モデル(LLM)によるデータ拡張と高度なエンコーダを統合するフレームワークを提案し,検証する。
まず、双方向およびゼロ/フェーショットプロンプト戦略の体系的評価によって最適化されたデータ拡張が、非常に効果的であることを実証した。
さらに、より広範な事前学習コーパスと拡張コンテキストウィンドウによって区別されるエンコーダを組み込むことにより、最先端の事前学習言語モデルに基づく確立された手法をさらに強化する。
論文 参考訳(メタデータ) (2025-09-24T14:14:21Z) - Large Language Models as Realistic Microservice Trace Generators [48.730974361862366]
本稿では,大規模言語モデル (LLM) を用いて, 合成作業負荷トレースを生成する手法を提案する。
我々はTraceLLMが様々な条件下で多様なリアルなトレースを生成し、精度と妥当性の両方において既存のアプローチよりも優れていることを示す。
TraceLLMは、キートレース機能を予測したり、欠落したデータを埋め込むといった、下流のトレース関連タスクに適応する。
論文 参考訳(メタデータ) (2024-12-16T12:48:04Z) - Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文 参考訳(メタデータ) (2024-10-09T06:26:39Z) - Requirements Traceability: Recovering and Visualizing Traceability Links
Between Requirements and Source Code of Object-oriented Software Systems [0.0]
要求からコードへのトレーサビリティリンク(RtC-TL)は、要求とソースコードのアーティファクトの関係を形作る。
本稿では、RtC-TLの復元と可視化のための自動アプローチと実装であるYamenTraceを紹介する。
論文 参考訳(メタデータ) (2023-07-09T11:01:16Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。