論文の概要: Natural Language-Programming Language Software Traceability Link Recovery Needs More than Textual Similarity
- arxiv url: http://arxiv.org/abs/2509.05585v1
- Date: Sat, 06 Sep 2025 04:15:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.599226
- Title: Natural Language-Programming Language Software Traceability Link Recovery Needs More than Textual Similarity
- Title(参考訳): 自然言語プログラミング言語 ソフトウェアトレーサビリティー・リンクのリカバリにはテキストの類似性以上のものが必要だ
- Authors: Zhiyuan Zou, Bangchao Wang, Peng Liang, Tingting Bi, Huan Jin,
- Abstract要約: プログラミング言語(NL-PL)アーティファクトを含むタスクでは、テキストの類似性のみに依存するのは意味的ギャップによって制限される。
実証分析により同定された複数のドメイン固有補助戦略を2つのモデルに組み込む手法を提案する。
実験の結果、HGTとGemini 2.5 Proはどちらもオリジナルのモデルを上回る性能を示した。
- 参考スコア(独自算出の注目度): 6.219855989110637
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of software traceability link recovery (TLR), textual similarity has long been regarded as the core criterion. However, in tasks involving natural language and programming language (NL-PL) artifacts, relying solely on textual similarity is limited by their semantic gap. To this end, we conducted a large-scale empirical evaluation across various types of TLR tasks, revealing the limitations of textual similarity in NL-PL scenarios. To address these limitations, we propose an approach that incorporates multiple domain-specific auxiliary strategies, identified through empirical analysis, into two models: the Heterogeneous Graph Transformer (HGT) via edge types and the prompt-based Gemini 2.5 Pro via additional input information. We then evaluated our approach using the widely studied requirements-to-code TLR task, a representative case of NL-PL TLR. Experimental results show that both the multi-strategy HGT and Gemini 2.5 Pro models outperformed their original counterparts without strategy integration. Furthermore, compared to the current state-of-the-art method HGNNLink, the multi-strategy HGT and Gemini 2.5 Pro models achieved average F1-score improvements of 3.68% and 8.84%, respectively, across twelve open-source projects, demonstrating the effectiveness of multi-strategy integration in enhancing overall model performance for the requirements-code TLR task.
- Abstract(参考訳): ソフトウェアトレーサビリティリンクリカバリ(TLR)の分野では、テキストの類似性は長い間コア基準とみなされてきた。
しかしながら、自然言語とプログラミング言語(NL-PL)アーティファクトを含むタスクでは、テキストの類似性のみに依存するのは、その意味的ギャップによって制限される。
そこで本研究では,NL-PLシナリオにおけるテキスト類似性の限界を明らかにするとともに,多種多様なTLRタスクに対して大規模な実証評価を行った。
これらの制約に対処するために、実証分析により同定された複数のドメイン固有の補助戦略を、エッジタイプによる異種グラフ変換器(HGT)と、追加入力情報によるプロンプトベースのGemini 2.5 Proの2つのモデルに組み込むアプローチを提案する。
そこで我々は,NL-PL TLRの代表的な事例である要求対コードTLRタスクを用いて,我々のアプローチを評価した。
実験結果から,HGTモデルとGemini 2.5 Proモデルの両方が,戦略統合を伴わないオリジナルのモデルよりも優れた性能を示した。
さらに、現在の最先端のHGNNLinkと比較して、HGTとGemini 2.5 Proのモデルは、12のオープンソースプロジェクトでそれぞれ3.68%と8.84%の平均F1スコアの改善を達成した。
関連論文リスト
- HOID-R1: Reinforcement Learning for Open-World Human-Object Interaction Detection Reasoning with Multimodal Large Language Model [13.82578761807402]
HOID-R1は,チェーン・オブ・シント(CoT)とグループ相対的ポリシー最適化のファインチューニングを統合した最初のHOI検出フレームワークである。
CoT推論における幻覚を軽減するために,CoT出力を監督するMLLM-as-a-judge機構を導入する。
実験により、HOID-R1はHOI検出ベンチマークの最先端性能を達成し、新しいシナリオへのオープンワールドの一般化における既存の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-08-15T09:28:57Z) - UR$^2$: Unify RAG and Reasoning through Reinforcement Learning [18.28138049751889]
大規模言語モデル(LLM)は2つの相補的パラダイムを通じて顕著な能力を示してきた: 検索-拡張生成(RAG)と、検証リワード(RLVR)からの強化学習(Reinforcement Learning)である。
我々は、強化学習による検索と推論を統一する一般的なフレームワークUR2(Unified RAG and Reasoning)を提案する。
オープンドメインQA、MMLU-Pro、医学、数学的推論タスクにわたる実験では、UR2が既存のRAG法やRL法よりも大幅に優れていることが示されている。
論文 参考訳(メタデータ) (2025-08-08T09:33:20Z) - AdaptGOT: A Pre-trained Model for Adaptive Contextual POI Representation Learning [7.277204616781735]
本稿では,Adaptive表現学習技術とGeographical-Co-Occurrence-Text表現を統合したAdaptGOTモデルを提案する。
アダプGOTモデルは、(1)KNN、密度ベース、重要度ベース、カテゴリー認識といった高度な混合サンプリング手法を統合して複雑なコンテキスト近傍を捕捉するコンテキスト近傍生成、(2)高品質でカスタマイズされた表現を導出し、POI間の複雑な相互関係を効率的に捉えるように設計された注意機構によって強化された高度なGOT表現、(3)位相整合性を保証するMoEベースの適応エンコーダ・デコーダアーキテクチャ、の3つの主要な構成要素から構成される。
論文 参考訳(メタデータ) (2025-06-21T08:06:06Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - T2I-Eval-R1: Reinforcement Learning-Driven Reasoning for Interpretable Text-to-Image Evaluation [60.620408007636016]
T2I-Eval-R1は,大まかな品質スコアのみを用いて,オープンソースのMLLMを訓練する新しい強化学習フレームワークである。
提案手法では,グループ相対政策最適化を命令調整プロセスに統合し,スカラースコアと解釈可能な推論チェーンの両方を生成する。
論文 参考訳(メタデータ) (2025-05-23T13:44:59Z) - SRPO: A Cross-Domain Implementation of Large-Scale Reinforcement Learning on LLM [18.275547804539016]
Two-Staged History-Resampling Policy 最適化は AIME24 と LiveCodeBench ベンチマークにおける DeepSeek-R1-Zero-32B のパフォーマンスを上回る。
本研究では,(1)数学的推論と符号化能力の両立を図った2段階のクロスドメイン・トレーニングパラダイム,(2)非効率なサンプルに対処する手法であるヒストリ・サンプリング(HR)を紹介する。
論文 参考訳(メタデータ) (2025-04-19T13:06:03Z) - Empowering Large Language Models in Wireless Communication: A Novel Dataset and Fine-Tuning Framework [81.29965270493238]
我々は,無線通信アプリケーションのための大規模言語モデル(LLM)の評価と微調整を目的とした,特殊なデータセットを開発した。
データセットには、真/偽と複数選択型を含む、さまざまなマルチホップ質問が含まれている。
本稿では,PVI(Pointwise V-Information)に基づく微調整手法を提案する。
論文 参考訳(メタデータ) (2025-01-16T16:19:53Z) - How to Make LLMs Strong Node Classifiers? [70.14063765424012]
言語モデル(LM)は、グラフニューラルネットワーク(GNN)やグラフトランスフォーマー(GT)など、ドメイン固有のモデルの優位性に挑戦している。
本稿では,ノード分類タスクにおける最先端(SOTA)GNNに匹敵する性能を実現するために,既製のLMを有効活用する手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T08:27:54Z) - Unified Language-driven Zero-shot Domain Adaptation [55.64088594551629]
Unified Language-driven Zero-shot Domain Adaptation (ULDA)は、新しいタスクセットである。
これにより、ドメインIDの知識を明示することなく、単一のモデルを多様なターゲットドメインに適応させることができる。
論文 参考訳(メタデータ) (2024-04-10T16:44:11Z) - Online Multi-Task Learning with Recursive Least Squares and Recursive Kernel Methods [50.67996219968513]
本稿では,オンラインマルチタスク学習(MTL)回帰問題に対する2つの新しいアプローチを紹介する。
入力空間の次元の2次パースタンスコストで精度よく近似的な再帰を実現する。
我々は,実世界の風速予測ケーススタディにおいて,オンラインMTL法と他の競技者との比較を行った。
論文 参考訳(メタデータ) (2023-08-03T01:41:34Z) - GAMUS: A Geometry-aware Multi-modal Semantic Segmentation Benchmark for
Remote Sensing Data [27.63411386396492]
本稿では,RGB-Height(RGB-H)データに基づくマルチモーダルセマンティックセマンティックセマンティクスのための新しいベンチマークデータセットを提案する。
提案するベンチマークは,1)共登録RGBとnDSMペアと画素単位のセマンティックラベルを含む大規模データセットと,2)リモートセンシングデータに基づく畳み込みとトランスフォーマーベースのネットワークのための既存のマルチモーダル融合戦略の包括的評価と解析からなる。
論文 参考訳(メタデータ) (2023-05-24T09:03:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。