論文の概要: Context Engineering for Multi-Agent LLM Code Assistants Using Elicit, NotebookLM, ChatGPT, and Claude Code
- arxiv url: http://arxiv.org/abs/2508.08322v1
- Date: Sat, 09 Aug 2025 14:45:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.171677
- Title: Context Engineering for Multi-Agent LLM Code Assistants Using Elicit, NotebookLM, ChatGPT, and Claude Code
- Title(参考訳): Elicit, NotebookLM, ChatGPT, Claude Code を用いたマルチエージェント LLM コードアシスタントのコンテキストエンジニアリング
- Authors: Muhammad Haseeb,
- Abstract要約: 大規模言語モデル(LLM)は、コード生成とソフトウェアエンジニアリングタスクの自動化において有望であることを示しているが、コンテキスト制限と知識ギャップのため、複雑なマルチファイルプロジェクトに苦戦することが多い。
ユーザ要求を明確にするIntent Translator (GPT-5)、ドメイン知識を注入するElicitを利用したセマンティック文献検索、コンテキスト理解のためのNotebookLMベースの文書合成、コード生成と検証のためのClaude Codeマルチエージェントシステムなど、複数のAIコンポーネントを組み合わせた新しいコンテキストエンジニアリングワークフローを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have shown promise in automating code generation and software engineering tasks, yet they often struggle with complex, multi-file projects due to context limitations and knowledge gaps. We propose a novel context engineering workflow that combines multiple AI components: an Intent Translator (GPT-5) for clarifying user requirements, an Elicit-powered semantic literature retrieval for injecting domain knowledge, NotebookLM-based document synthesis for contextual understanding, and a Claude Code multi-agent system for code generation and validation. Our integrated approach leverages intent clarification, retrieval-augmented generation, and specialized sub-agents orchestrated via Claude's agent framework. We demonstrate that this method significantly improves the accuracy and reliability of code assistants in real-world repositories, yielding higher single-shot success rates and better adherence to project context than baseline single-agent approaches. Qualitative results on a large Next.js codebase show the multi-agent system effectively plans, edits, and tests complex features with minimal human intervention. We compare our system with recent frameworks like CodePlan, MASAI, and HyperAgent, highlighting how targeted context injection and agent role decomposition lead to state-of-the-art performance. Finally, we discuss the implications for deploying LLM-based coding assistants in production, along with lessons learned on context management and future research directions.
- Abstract(参考訳): 大規模言語モデル(LLM)は、コード生成とソフトウェアエンジニアリングタスクの自動化において有望であることを示しているが、コンテキスト制限と知識ギャップのため、複雑なマルチファイルプロジェクトに苦戦することが多い。
ユーザ要求を明確にするためのIntent Translator (GPT-5)、ドメイン知識を注入するためのElicitを利用したセマンティック文献検索、文脈理解のためのNotebookLMベースの文書合成、コード生成と検証のためのClaude Codeマルチエージェントシステムなど、複数のAIコンポーネントを組み合わせた新しいコンテキストエンジニアリングワークフローを提案する。
我々の統合的なアプローチは、意図の明確化、検索強化生成、およびClaudeのエージェントフレームワークを介して編成された特殊なサブエージェントを活用する。
本手法は, 実世界のリポジトリにおけるコードアシスタントの精度と信頼性を大幅に向上させ, 単一ショットの成功率とプロジェクトコンテキストへの付着性をベースラインの単一エージェントアプローチよりも向上させることを実証する。
大規模なNext.jsコードベースの質的な結果は、マルチエージェントシステムが人間の介入を最小限に抑えて複雑な機能を効果的に計画、編集、テストしていることを示している。
CodePlan、MASAI、HyperAgentといった最近のフレームワークと比較し、ターゲットとなるコンテキストインジェクションとエージェントロールの分解が最先端のパフォーマンスにどのように寄与するかを強調します。
最後に、LLMベースのコーディングアシスタントを実運用環境に展開することの意味と、コンテキスト管理や今後の研究の方向性について学んだ教訓について議論する。
関連論文リスト
- Graph-Augmented Large Language Model Agents: Current Progress and Future Prospects [53.24831948221361]
グラフ拡張LDMエージェント(GLA)は複雑なエージェントシステムの構造、連続性、調整を強化する。
本稿では,最近の進歩の概要をタイムリーかつ包括的に紹介し,今後の研究の方向性を明らかにする。
本論文は,GLAにおける今後の研究のロードマップとして機能し,GLAエージェントシステムにおけるグラフの役割のより深い理解を促進することを願っている。
論文 参考訳(メタデータ) (2025-07-29T00:27:12Z) - AgentMesh: A Cooperative Multi-Agent Generative AI Framework for Software Development Automation [0.0]
ソフトウェア開発タスクの自動化に複数のLCMエージェントを併用したPythonベースのフレームワークを提案する。
AgentMeshでは、Planner、Coder、Debugger、Reviewerといった特殊なエージェントが協力して、ハイレベルな要件を完全に実現されたコードに変換する。
論文 参考訳(メタデータ) (2025-07-26T10:10:02Z) - Deep Research Agents: A Systematic Examination And Roadmap [79.04813794804377]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - Talk Structurally, Act Hierarchically: A Collaborative Framework for LLM Multi-Agent Systems [10.67359331022116]
textitTalk 構造的には、Act Hierarchically (TalkHier) はコンテキスト豊富な交換のための構造化通信プロトコルを導入する新しいフレームワークである。
textitTalkHierは、推論スケーリングモデル(OpenAI-o1)、オープンソースのマルチエージェントモデル(AgentVerseなど)など、さまざまな種類のSoTAを追い越している。
論文 参考訳(メタデータ) (2025-02-16T12:26:58Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z) - AgentLite: A Lightweight Library for Building and Advancing
Task-Oriented LLM Agent System [91.41155892086252]
LLMエージェントの研究を簡略化する新しいAIエージェントライブラリであるAgentLiteをオープンソースとして公開する。
AgentLiteは、タスクを分解するエージェントの機能を強化するために設計されたタスク指向フレームワークである。
我々は,その利便性と柔軟性を示すために,AgentLiteで開発された実用アプリケーションを紹介した。
論文 参考訳(メタデータ) (2024-02-23T06:25:20Z) - ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文 参考訳(メタデータ) (2023-11-16T12:03:21Z) - MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework [32.95727162682409]
マルチエージェントコラボレーションに効率的な人間を取り入れた,革新的なメタプログラミングフレームワークであるMetaGPTを紹介する。
MetaGPTは、より合理化された検証のために、SOP(Standardized Operating Procedures)をプロンプトシーケンスにエンコードする。
協調ソフトウェアエンジニアリングベンチマークでは、MetaGPTは従来のチャットベースのマルチエージェントシステムよりも一貫性のあるソリューションを生成する。
論文 参考訳(メタデータ) (2023-08-01T07:49:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。