論文の概要: A Novel Approach for Automated Design Information Mining from Issue Logs
- arxiv url: http://arxiv.org/abs/2405.19623v1
- Date: Thu, 30 May 2024 02:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-31 18:36:41.407824
- Title: A Novel Approach for Automated Design Information Mining from Issue Logs
- Title(参考訳): 課題ログからの自動設計情報マイニングのための新しいアプローチ
- Authors: Jiuang Zhao, Zitian Yang, Li Zhang, Xiaoli Lian, Donghao Yang,
- Abstract要約: DRMinerは、オープンソースコミュニティにおける開発者のライブディスカッションから、潜在設計の根拠を自動的に掘り下げる新しい方法である。
私たちはJiraのCassandra、Flink、Solrリポジトリからイシューログを取得し、それを注釈付けして厳格なスキームで処理します。
DRMinerは設計の合理性についてF1スコアを65%獲得し、GPT-4.0よりも7%向上した。
- 参考スコア(独自算出の注目度): 3.5665328754813768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software architectures are usually meticulously designed to address multiple quality concerns and support long-term maintenance. However, due to the imbalance between the cost and value for developers to document design rationales (i.e., the design alternatives and the underlying arguments for making or rejecting decisions), these rationales are often obsolete or even missing. The lack of design knowledge has motivated a number of studies to extract design information from various platforms in recent years. Unfortunately, despite the wealth of discussion records related to design information provided by platforms like open-source communities, existing research often overlooks the underlying arguments behind alternatives due to challenges such as the intricate semantics of discussions and the lack of benchmarks for design rationale extraction. In this paper, we propose a novel method, named by DRMiner, to automatically mine latent design rationales from developers' live discussion in open-source community (i.e., issue logs in Jira). To better identify solutions and the arguments supporting them, DRMiner skillfully decomposes the problem into multiple text classification tasks and tackles them using prompt tuning of language models and customized text-related features. To evaluate DRMiner, we acquire issue logs from Cassandra, Flink, and Solr repositories in Jira, and then annotate and process them under a rigorous scheme, ultimately forming a dataset for design rationale mining. Experimental results show that DRMiner achieves an F1 score of 65% for mining design rationales, outperforming all baselines with a 7% improvement over GPT-4.0. Furthermore, we investigate the usefulness of the design rationales mined by DRMiner for automated program repair (APR) and find that the design rationales significantly enhance APR, achieving 14 times higher full-match repairs on average.
- Abstract(参考訳): ソフトウェアアーキテクチャは通常、複数の品質問題に対処し、長期的なメンテナンスをサポートするために慎重に設計されている。
しかしながら、設計の合理性を文書化するコストと価値の不均衡(すなわち、設計の代替案と決定を下すための根底にある議論)のため、これらの合理性はしばしば時代遅れまたは欠落している。
デザイン知識の欠如は、近年、様々なプラットフォームからデザイン情報を抽出する多くの研究の動機となっている。
残念なことに、オープンソースコミュニティのようなプラットフォームが提供する設計情報に関する豊富な議論記録にもかかわらず、既存の研究は、議論の複雑な意味論や設計の合理性抽出のためのベンチマークの欠如といった課題によって、代替案の背後にある議論を無視することが多い。
本稿では,オープンソースコミュニティにおける開発者のライブディスカッション(つまりJiraの発行ログ)から,遅延設計の論理的根拠を自動的に抽出する,DRMinerという新しい手法を提案する。
DRMinerは、解とそれらをサポートする引数をより正確に識別するために、問題を複数のテキスト分類タスクに巧みに分解し、言語モデルの迅速なチューニングとカスタマイズされたテキスト関連機能を使用してそれらに取り組む。
DRMinerを評価するために、JiraのCassandra、Flink、Solrリポジトリからイシューログを取得し、厳密なスキームの下で注釈付けして処理し、最終的には設計合理的マイニングのためのデータセットを作成します。
実験の結果、DRMinerは設計の合理性についてF1スコアを65%達成し、GPT-4.0よりも7%改善した。
さらに,DRMinerによる自動プログラム修復(APR)設計の合理性について検討し,設計の合理性によってAPRが大幅に向上し,平均14倍の完全整合性が得られることを示した。
関連論文リスト
- Reasoning Paths Optimization: Learning to Reason and Explore From Diverse Paths [69.39559168050923]
本稿では,多様な経路から学習の推論と探索を可能にするReasoning Paths Optimization (RPO)を紹介する。
提案手法は,各推論ステップにおいて好意的な分岐を奨励し,好ましくない分岐を罰し,モデル全体の問題解決性能を高める。
我々は,数語問題や理科ベースの試験問題など,多段階の推論タスクに焦点をあてる。
論文 参考訳(メタデータ) (2024-10-07T06:37:25Z) - Can We Further Elicit Reasoning in LLMs? Critic-Guided Planning with Retrieval-Augmentation for Solving Challenging Tasks [68.49251303172674]
最先端の大規模言語モデル(LLM)は、目覚ましい問題解決能力を示すが、複雑な推論と事実の正しさに苦慮する可能性がある。
既存の手法では、チェーン・オブ・ソートと検索強化生成(RAG)の強みを利用して、複雑な問題をより単純なステップに分解し、検索を適用して事実の正しさを向上させる。
CR-Planner(CR-Planner, CR-Planner, CR-Planner)は, 微調整された批判モデルを利用して, 推論と検索の両方のプロセスを計画を通してガイドする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-10-02T11:26:02Z) - Enhancing Automated Program Repair with Solution Design [5.547148114448699]
DRCodePilot は GPT-4-Turbo の APR 機能を DR をプロンプト命令に組み込むことで拡張する手法である。
DRCodePilotはGPT-4を直接利用するよりも4.7倍高いフルマッチ比を達成しています。
論文 参考訳(メタデータ) (2024-08-22T01:13:02Z) - Qualitative analysis of the relationship between design smells and
software engineering challenges [3.9704849108478704]
本研究は,大量のソースコードを解析することにより,Javaソフトウェアの設計臭い検出に使用するツールを提供する。
ツールの出力に基づいて、検出された設計の臭いの原因を「不規則なチームミーティング」と「スコープクリープ」という2つのソフトウェアエンジニアリング課題に関連付ける研究を行った。
論文 参考訳(メタデータ) (2023-10-22T23:21:13Z) - Abstract Meaning Representation-Based Logic-Driven Data Augmentation for Logical Reasoning [27.224364543134094]
本稿では,論理駆動型データ拡張手法AMR-LDAを提案する。
AMR-LDAは元のテキストを抽象的意味表現(AMR)グラフに変換する。
修正されたAMRグラフは、拡張データを生成するためにテキストに変換される。
論文 参考訳(メタデータ) (2023-05-21T23:16:26Z) - A Deep Learning Framework for Verilog Autocompletion Towards Design and
Verification Automation [0.33598755777055367]
本稿では,Verilog自動補完モデルの学習のための新しいディープラーニングフレームワークを提案する。
このフレームワークは、一般的なプログラミング言語のデータに基づいて事前訓練されたモデルを統合し、ターゲットの下流タスクに類似するようにキュレートされたデータセット上でそれらを微調整する。
実験により、提案されたフレームワークは、スクラッチからトレーニングされたモデルと比較して、それぞれ9.5%、6.7%、および6.9%、BLEU、ROUGE-L、chrFのスコアが向上することが示された。
論文 参考訳(メタデータ) (2023-04-26T21:56:03Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - Deconstructing Self-Supervised Monocular Reconstruction: The Design
Decisions that Matter [63.5550818034739]
本稿では,自己教師付き単分子深度推定への最先端の貢献を評価するための枠組みを提案する。
事前トレーニング、バックボーン、アーキテクチャ設計の選択、損失関数が含まれる。
我々は16の最先端コントリビューションを再実装し、検証し、再評価し、新しいデータセットを導入します。
論文 参考訳(メタデータ) (2022-08-02T14:38:53Z) - Towards Complex Document Understanding By Discrete Reasoning [77.91722463958743]
VQA(Document Visual Question Answering)は、自然言語による質問に答えるために、視覚的に豊富なドキュメントを理解することを目的としている。
我々は3,067の文書ページと16,558の質問応答ペアからなる新しいドキュメントVQAデータセットTAT-DQAを紹介する。
我々は,テキスト,レイアウト,視覚画像など,多要素の情報を考慮に入れたMHSTという新しいモデルを開発し,異なるタイプの質問にインテリジェントに対処する。
論文 参考訳(メタデータ) (2022-07-25T01:43:19Z) - A survey on Variational Autoencoders from a GreenAI perspective [0.0]
変分オートエンコーダ(VAE)は、統計や情報理論の要素と深層ニューラルネットワークが提供する柔軟性を融合する強力な生成モデルである。
この記事では、最も成功し、最近のVAEのバリエーションについて比較評価する。
論文 参考訳(メタデータ) (2021-03-01T15:26:39Z) - Semantic Graphs for Generating Deep Questions [98.5161888878238]
本稿では、まず、入力文書のセマンティックレベルグラフを構築し、次にアテンションベースのGGNN(Att-GGNN)を導入してセマンティックグラフを符号化する新しいフレームワークを提案する。
HotpotQAのDeep-question中心のデータセットでは、複数の事実の推論を必要とする問題よりもパフォーマンスが大幅に向上し、最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-27T10:52:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。