論文の概要: Query2Diagram: Answering Developer Queries with UML Diagrams
- arxiv url: http://arxiv.org/abs/2604.23816v1
- Date: Sun, 26 Apr 2026 17:34:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.570904
- Title: Query2Diagram: Answering Developer Queries with UML Diagrams
- Title(参考訳): Query2Diagram:UMLダイアグラムによる開発者クエリの回答
- Authors: Oleg Baryshnikov, Anton M. Alekseev, Sergey I. Nikolenko,
- Abstract要約: クエリ駆動型ダイアグラム生成を導入する。
コードファイルのキュレートされたデータセット上でQwen2.5-Coder-14Bを微調整する。
その結果,手動で修正したデータの微調整により,大幅な改善が得られた。
- 参考スコア(独自算出の注目度): 7.42369031190836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software documentation frequently becomes outdated or fails to exist entirely, yet developers need focused views of their codebase to understand complex systems. While automated reverse engineering tools can generate UML diagrams from code, they produce overwhelming detail without considering developer intent. We introduce query-driven UML diagram generation, where LLMs create diagrams that directly answer natural language questions about code. Unlike existing methods, our approach produces semantically focused diagrams containing only relevant elements with contextual descriptions. We fine-tune Qwen2.5-Coder-14B on a curated dataset of code files, developer queries, and corresponding diagram representations in a structured JSON format, evaluating with both automatic detection of structural defects and human assessment of semantic relevance. Results demonstrate that fine-tuning on a modest amount of manually corrected data yields dramatic improvements: our best model achieves the highest F1 scores while reducing defect rates below state-of-the-art LLMs, generating diagrams that are both structurally sound and semantically faithful to developer queries. Thus, we establish the feasibility of using LLMs for scalable contextual, on-demand documentation generation. We make our code and dataset publicly available at https://github.com/i-need-a-pencil/query2diagram.
- Abstract(参考訳): ソフトウェアドキュメンテーションは時代遅れになり、完全に存在しないことが多いが、開発者は複雑なシステムを理解するためにコードベースを集中的に見る必要がある。
自動化されたリバースエンジニアリングツールはコードからUMLダイアグラムを生成することができるが、開発者意図を考慮せずに圧倒的な詳細を生成する。
クエリ駆動のUMLダイアグラム生成を導入し、LLMはコードに関する自然言語の質問に直接答えるダイアグラムを作成します。
既存手法とは異なり,本手法は文脈記述を伴う要素のみを含む意味的に焦点を絞った図を生成する。
我々は、構造化JSONフォーマットでコードファイル、開発者クエリ、および対応するダイアグラム表現のキュレートされたデータセット上にQwen2.5-Coder-14Bを微調整し、構造的欠陥の自動検出と意味的関連性の評価の両方で評価する。
我々の最良のモデルは、最先端のLLMよりも欠陥率を低くし、構造的に健全で、開発者のクエリにセマンティックに忠実なダイアグラムを生成しながら、最高のF1スコアを達成する。
そこで我々は,スケーラブルなコンテキスト・オンデマンドドキュメンテーション生成のためのLLMの実現可能性を確立した。
コードとデータセットをhttps://github.com/i-need-a-pencil/query2diagramで公開しています。
関連論文リスト
- UltRAG: a Universal Simple Scalable Recipe for Knowledge Graph RAG [4.612466149994232]
Retrieval augmented generation (RAG) は、知識コーパス内の情報を特定し、それをモデルのコンテキストウィンドウに配置することで、事実エラーを減らそうとする。
本稿では,従来のRAGから切り離された知識グラフから情報を取得するための一般的なフレームワークであるULTRAGを紹介する。
我々の実験では、ULTRAGは最先端のKG-RAGソリューションと比較して性能が向上する。
論文 参考訳(メタデータ) (2026-01-28T14:31:29Z) - AmbiGraph-Eval: Can LLMs Effectively Handle Ambiguous Graph Queries? [31.91169297907121]
AmbiGraph-Evalは、専門家が検証したグラフクエリの回答と組み合わせた、現実世界のあいまいなクエリの新しいベンチマークである。
本研究は, 曖昧性処理における重要なギャップを明らかにし, 特殊解像度技術における今後の課題を動機づけるものである。
論文 参考訳(メタデータ) (2025-08-13T09:06:59Z) - MCeT: Behavioral Model Correctness Evaluation using Large Language Models [4.34964016971127]
AIモデリングアシスタントとしてのLarge Language Models(LLM)の利用の増加に伴い、ダイアグラムの生成により多くの自動化が関与するようになる。
本稿では,行動モデル,特にシーケンス図の正しさを,対応する要求テキストに対して評価する最初の完全自動化ツールMCeTを提案する。
論文 参考訳(メタデータ) (2025-08-01T13:41:58Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - Behavioral Augmentation of UML Class Diagrams: An Empirical Study of Large Language Models for Method Generation [0.0]
本研究では, 大規模言語モデル(LLM)を用いて, 21 の構造化廃棄物処理事例を用いて, メソドレスダイアグラム(21 クラス, 17 の関係性)を増強する。
合計90の図(3,373の方法)が6回にわたって評価された。
論文 参考訳(メタデータ) (2025-06-01T02:33:40Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [81.18701211912779]
本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-12-24T16:38:04Z) - DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning [62.51232333352754]
テキスト・ツー・イメージ(T2I)世代はここ数年で著しい成長を遂げている。
それにもかかわらず、T2Iモデルでダイアグラムを生成する作業はほとんど行われていない。
本稿では,新しい2段階のテキスト・ツー・ダイアグラム生成フレームワークであるDiagrammerGPTを紹介する。
我々のフレームワークは、既存のT2Iモデルを上回る精度で、より正確なダイアグラムを生成する。
論文 参考訳(メタデータ) (2023-10-18T17:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。