論文の概要: DomAgent: Leveraging Knowledge Graphs and Case-Based Reasoning for Domain-Specific Code Generation
- arxiv url: http://arxiv.org/abs/2603.21430v1
- Date: Sun, 22 Mar 2026 22:39:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.414002
- Title: DomAgent: Leveraging Knowledge Graphs and Case-Based Reasoning for Domain-Specific Code Generation
- Title(参考訳): DomAgent: ドメイン特化コード生成のための知識グラフの活用とケースベースの推論
- Authors: Shuai Wang, Dhasarathy Parthasarathy, Robert Feldt, Yinan Yu,
- Abstract要約: DomAgentは大規模言語モデル(LLM)のための自律型コーディングエージェントである
DomRetrieverは、人間がドメイン固有の知識を学ぶ方法をエミュレートする、新しい検索モジュールだ。
実験の結果,DomAgentはドメイン固有のコード生成を大幅に向上させることがわかった。
- 参考スコア(独自算出の注目度): 10.633307460813523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have shown impressive capabilities in code generation. However, because most LLMs are trained on public domain corpora, directly applying them to real-world software development often yields low success rates, as these scenarios frequently require domain-specific knowledge. In particular, domain-specific tasks usually demand highly specialized solutions, which are often underrepresented or entirely absent in the training data of generic LLMs. To address this challenge, we propose DomAgent, an autonomous coding agent that bridges this gap by enabling LLMs to generate domain-adapted code through structured reasoning and targeted retrieval. A core component of DomAgent is DomRetriever, a novel retrieval module that emulates how humans learn domain-specific knowledge, by combining conceptual understanding with experiential examples. It dynamically integrates top-down knowledge-graph reasoning with bottom-up case-based reasoning, enabling iterative retrieval and synthesis of structured knowledge and representative cases to ensure contextual relevance and broad task coverage. DomRetriever can operate as part of DomAgent or independently with any LLM for flexible domain adaptation. We evaluate DomAgent on an open benchmark dataset in the data science domain (DS-1000) and further apply it to real-world truck software development tasks. Experimental results show that DomAgent significantly enhances domain-specific code generation, enabling small open-source models to close much of the performance gap with large proprietary LLMs in complex, real-world applications. The code is available at: https://github.com/Wangshuaiia/DomAgent.
- Abstract(参考訳): 大規模言語モデル(LLM)は、コード生成において印象的な機能を示している。
しかしながら、ほとんどのLLMはパブリックドメインのコーパスでトレーニングされているため、実際のソフトウェア開発に直接適用すると、ドメイン固有の知識を必要とすることが多いため、成功率が低い場合が多い。
特に、ドメイン固有のタスクは、通常高度に専門化されたソリューションを必要とするが、ジェネリックLLMのトレーニングデータには、しばしば不足しているか、完全に欠落している。
この課題に対処するために、構造化推論とターゲット検索を通じてLLMがドメイン適応コードを生成することで、このギャップを埋める自律的符号化エージェントであるDomAgentを提案する。
DomAgentのコアコンポーネントであるDomRetrieverは、概念的理解と経験的な例を組み合わせることで、人間がドメイン固有の知識を学ぶ方法をエミュレートする新しい検索モジュールである。
トップダウンの知識グラフ推論とボトムアップのケースベースの推論を動的に統合し、構造化された知識と代表的事例の反復的検索と合成を可能にし、文脈的関連性と幅広いタスクカバレッジを確保する。
DomRetrieverはDomAgentの一部として、あるいは任意のLLMと独立して、柔軟なドメイン適応を行うことができる。
我々はDomAgentをデータサイエンス領域(DS-1000)のオープンなベンチマークデータセットで評価し、実際のトラックソフトウェア開発タスクに適用する。
実験結果から,DomAgentはドメイン固有のコード生成を著しく向上させ,複雑な実世界のアプリケーションにおいて,小さなオープンソースモデルでLLMの大規模プロプライエタリな性能ギャップの大部分を埋めることができた。
コードは、https://github.com/Wangshuaiia/DomAgent.comで入手できる。
関連論文リスト
- Top General Performance = Top Domain Performance? DomainCodeBench: A Multi-domain Code Generation Benchmark [38.14474956762422]
DomainCodeBenchは、12のソフトウェアアプリケーションドメインと15のプログラミング言語にわたる大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
トップ・ジェネラル・ドメイン・モデルは特定のアプリケーション・ドメインで一貫して排他的でないことが分かりました。
ドメイン固有の知識による拡張プロンプトは、パフォーマンスを約38.17%向上させる。
論文 参考訳(メタデータ) (2024-12-24T17:56:08Z) - AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文 参考訳(メタデータ) (2024-10-17T17:50:38Z) - DOMAINEVAL: An Auto-Constructed Benchmark for Multi-Domain Code Generation [48.11754113512047]
この研究には、コード生成ベンチマークデータセットであるDOMAINEVALが含まれており、6つの人気のあるドメインを含んでいる。
私たちのパイプラインは完全に自動化され、コードリポジトリから研究対象のフォーマットへのプッシュボットの構築が可能になります。
本研究のコントリビューションには、コード生成ベンチマークデータセットであるDOMAINEVAL、コードベンチマークを構築するための完全自動化パイプライン、DOMAINEVALのパフォーマンスに基づいたコード生成タスクにおけるLLMの制限の識別が含まれている。
論文 参考訳(メタデータ) (2024-08-23T16:33:58Z) - Large Language Model based Multi-Agents: A Survey of Progress and Challenges [44.92286030322281]
大規模言語モデル(LLM)は、幅広いタスクで大きな成功を収めています。
近年, 1 つの LLM を単一計画や意思決定エージェントとして利用する手法の開発により, 複雑な問題解決や世界シミュレーションにおいて, LLM ベースのマルチエージェントシステムは大きな進歩を遂げている。
論文 参考訳(メタデータ) (2024-01-21T23:36:14Z) - Enhancing Open-Domain Task-Solving Capability of LLMs via Autonomous Tool Integration from GitHub [79.31134731122462]
オープンドメインのタスク解決能力を評価するためにOpenActベンチマークを導入します。
我々は,オープンドメインの進化するクエリに,GitHubから専門ツールを自律的に統合することで対処できる,新しいLLMベースのエージェントシステムであるOpenAgentを紹介する。
論文 参考訳(メタデータ) (2023-12-28T15:47:30Z) - Knowledge Plugins: Enhancing Large Language Models for Domain-Specific
Recommendations [50.81844184210381]
本稿では,大規模言語モデルをDOmain固有のKnowledgEで拡張し,実践的アプリケーション,すなわちDOKEの性能を向上させるためのパラダイムを提案する。
このパラダイムはドメイン知識抽出器に依存し,1)タスクに効果的な知識を準備すること,2)特定のサンプルごとに知識を選択すること,3)LLMで理解可能な方法で知識を表現すること,の3つのステップで動作する。
論文 参考訳(メタデータ) (2023-11-16T07:09:38Z) - Recommender AI Agent: Integrating Large Language Models for Interactive
Recommendations [53.76682562935373]
我々は,LLMを脳として,レコメンダモデルをツールとして使用する,textbfInteRecAgentという効率的なフレームワークを紹介した。
InteRecAgentは会話レコメンデーションシステムとして満足度を達成し、汎用LLMよりも優れる。
論文 参考訳(メタデータ) (2023-08-31T07:36:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。