論文の概要: From Issues to Insights: RAG-based Explanation Generation from Software Engineering Artifacts
- arxiv url: http://arxiv.org/abs/2601.05721v1
- Date: Fri, 09 Jan 2026 11:05:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.950292
- Title: From Issues to Insights: RAG-based Explanation Generation from Software Engineering Artifacts
- Title(参考訳): 課題から洞察へ - ソフトウェアエンジニアリング成果物からのRAGベースの説明生成
- Authors: Daniel Pöttgen, Mersedeh Sadeghi, Max Unterbusch, Andreas Vogelsang,
- Abstract要約: 我々は,問題追跡データから説明文を生成するために,最初にRAG(Retrieval-Augmented Generation)アプローチを適用した。
提案する概念実証システムはオープンソースツールと言語モデルを用いて実装され,構造化された課題データを利用した説明生成の可能性を示す。
- 参考スコア(独自算出の注目度): 1.18094111609063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing complexity of modern software systems has made understanding their behavior increasingly challenging, driving the need for explainability to improve transparency and user trust. Traditional documentation is often outdated or incomplete, making it difficult to derive accurate, context-specific explanations. Meanwhile, issue-tracking systems capture rich and continuously updated development knowledge, but their potential for explainability remains untapped. With this work, we are the first to apply a Retrieval-Augmented Generation (RAG) approach for generating explanations from issue-tracking data. Our proof-of-concept system is implemented using open-source tools and language models, demonstrating the feasibility of leveraging structured issue data for explanation generation. Evaluating our approach on an exemplary project's set of GitHub issues, we achieve 90% alignment with human-written explanations. Additionally, our system exhibits strong faithfulness and instruction adherence, ensuring reliable and grounded explanations. These findings suggest that RAG-based methods can extend explainability beyond black-box ML models to a broader range of software systems, provided that issue-tracking data is available - making system behavior more accessible and interpretable.
- Abstract(参考訳): 現代のソフトウェアシステムの複雑さが増すにつれ、彼らの行動を理解することはますます難しくなり、透明性とユーザ信頼を改善するための説明可能性の必要性が増している。
従来の文書はしばしば時代遅れまたは不完全であり、正確で文脈固有の説明を引き出すのが困難である。
一方、課題追跡システムは、リッチで継続的な更新された開発知識を捉えているが、その説明可能性の可能性は未解決のままである。
本研究により,問題追跡データから説明文を生成するために,検索型拡張生成(RAG)アプローチを初めて適用した。
提案する概念実証システムはオープンソースツールと言語モデルを用いて実装され,構造化された課題データを利用した説明生成の可能性を示す。
模範的なプロジェクトのGitHub問題に対するアプローチを評価することで、人間による説明と90%の一致を実現しています。
さらに,本システムは,信頼性と根拠のある説明を確実にする,強い忠実さと指導の順守を示す。
これらの結果は、RAGベースの手法がブラックボックスMLモデルを超えて幅広いソフトウェアシステムに説明可能性を拡張することを示唆している。
関連論文リスト
- ReAG: Reasoning-Augmented Generation for Knowledge-based Visual Question Answering [54.72902502486611]
ReAG(Reasoning-Augmented Multimodal RAG)は、粗い部分ときめ細かい部分の検索と、無関係な通路をフィルタリングする批評家モデルを組み合わせた手法である。
ReAGは従来の手法よりも優れており、解答精度が向上し、検索された証拠に根ざした解釈可能な推論を提供する。
論文 参考訳(メタデータ) (2025-11-27T19:01:02Z) - Does Understanding Inform Generation in Unified Multimodal Models? From Analysis to Path Forward [33.56471468540189]
データ漏洩を回避するために、制御された合成データセットと組み合わせた分離評価フレームワークUniSandboxを紹介する。
本研究は, 推論生成と知識伝達の2つの重要な側面に主に反映される, 重要な理解・生成ギャップを明らかにした。
UniSandboxは、将来の統合アーキテクチャや、理解と生成のギャップを真に埋めるトレーニング戦略を設計するための予備的な洞察を提供する。
論文 参考訳(メタデータ) (2025-11-25T17:58:48Z) - Taming Imperfect Process Verifiers: A Sampling Perspective on Backtracking [54.43083499412643]
言語モデルの生成能力をプロセス検証器と組み合わせたテストタイムアルゴリズムは、新しい推論能力を引き出すための有望なレバーを提供する。
提案手法は, 理論的に根拠付きバックトラックを用いて, 検証誤差に対して, 確実な堅牢性を実現するための新しいプロセス誘導型テスト時間サンプリングアルゴリズムであるVGBを導入する。
論文 参考訳(メタデータ) (2025-10-03T16:21:14Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - G-Refer: Graph Retrieval-Augmented Large Language Model for Explainable Recommendation [48.23263809469786]
本稿では,グラフ検索拡張大言語モデル (LLM) を用いた提案手法を提案する。
G-Referは、説明可能性と安定性の両方において既存の手法と比較して優れた性能を達成する。
論文 参考訳(メタデータ) (2025-02-18T06:42:38Z) - Developing Retrieval Augmented Generation (RAG) based LLM Systems from PDFs: An Experience Report [3.4632900249241874]
本稿では,PDF文書を主データ源とする検索拡張生成システム(RAG)の開発経験報告について述べる。
RAGアーキテクチャは、Large Language Models (LLM) の生成能力と情報検索の精度を組み合わせたものである。
この研究の実際的な意味は、様々な分野における生成AIシステムの信頼性を高めることである。
論文 参考訳(メタデータ) (2024-10-21T12:21:49Z) - Retrieval-Augmented Generation for Large Language Models: A Survey [17.82361213043507]
大きな言語モデル(LLM)には印象的な能力があるが、幻覚のような課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2023-12-18T07:47:33Z) - IRJIT: A Simple, Online, Information Retrieval Approach for Just-In-Time Software Defect Prediction [10.084626547964389]
Just-in-Timeソフトウェア欠陥予測(JIT-SDP)は、コミットチェックイン時にそれらを特定することによって、ソフトウェアへの欠陥の導入を防止する。
現在のソフトウェア欠陥予測アプローチは、変更メトリクスなどの手作業による機能に依存しており、マシンラーニングやディープラーニングモデルのトレーニングにコストがかかる。
我々は,ソースコード上の情報検索を利用して,過去のバグやクリーンなコミットと類似性に基づいて,新しいコミットをバグやクリーンとしてラベル付けするIRJITという手法を提案する。
論文 参考訳(メタデータ) (2022-10-05T17:54:53Z) - KAT: A Knowledge Augmented Transformer for Vision-and-Language [56.716531169609915]
我々は、OK-VQAのオープンドメインマルチモーダルタスクにおいて、最先端の強力な結果をもたらす新しいモデルである知識拡張トランスフォーマー(KAT)を提案する。
提案手法は,エンド・ツー・エンドのエンコーダ・デコーダアーキテクチャにおいて暗黙的かつ明示的な知識を統合しつつ,回答生成時に両知識源を共同で推論する。
我々の分析では、モデル予測の解釈可能性の向上に、明示的な知識統合のさらなる利点が見られる。
論文 参考訳(メタデータ) (2021-12-16T04:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。