論文の概要: How to Build AI Agents by Augmenting LLMs with Codified Human Expert Domain Knowledge? A Software Engineering Framework
- arxiv url: http://arxiv.org/abs/2601.15153v1
- Date: Wed, 21 Jan 2026 16:23:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.453537
- Title: How to Build AI Agents by Augmenting LLMs with Codified Human Expert Domain Knowledge? A Software Engineering Framework
- Title(参考訳): 人間の知識をコード化したLLMでAIエージェントを構築するには? ソフトウェアエンジニアリングフレームワーク
- Authors: Choro Ulan uulu, Mikhail Kulyabin, Iris Fuhrmann, Jan Joosten, Nuno Miguel Martins Pacheco, Filippos Petridis, Rebecca Johnson, Jan Bosch, Helena Holmström Olsson,
- Abstract要約: 批判的なドメイン知識は、通常、少数の専門家と共に存在する。
非専門家は効果的な可視化を作成するのに苦労する。
本稿では,AIエージェントシステムに人間のドメイン知識を取り込み,組み込む方法について検討する。
- 参考スコア(独自算出の注目度): 3.0049184484925604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Critical domain knowledge typically resides with few experts, creating organizational bottlenecks in scalability and decision-making. Non-experts struggle to create effective visualizations, leading to suboptimal insights and diverting expert time. This paper investigates how to capture and embed human domain knowledge into AI agent systems through an industrial case study. We propose a software engineering framework to capture human domain knowledge for engineering AI agents in simulation data visualization by augmenting a Large Language Model (LLM) with a request classifier, Retrieval-Augmented Generation (RAG) system for code generation, codified expert rules, and visualization design principles unified in an agent demonstrating autonomous, reactive, proactive, and social behavior. Evaluation across five scenarios spanning multiple engineering domains with 12 evaluators demonstrates 206% improvement in output quality, with our agent achieving expert-level ratings in all cases versus baseline's poor performance, while maintaining superior code quality with lower variance. Our contributions are: an automated agent-based system for visualization generation and a validated framework for systematically capturing human domain knowledge and codifying tacit expert knowledge into AI agents, demonstrating that non-experts can achieve expert-level outcomes in specialized domains.
- Abstract(参考訳): 重要なドメイン知識は、通常、少数の専門家と共に存在し、スケーラビリティと意思決定において組織的なボトルネックを生み出します。
非専門家は効果的な可視化を作成するのに苦労し、最適以下の洞察と専門家の時間を分散させます。
本稿では,産業ケーススタディを通じて,人間のドメイン知識をAIエージェントシステムに取り込み,組み込む方法について検討する。
本稿では,大規模言語モデル(LLM)を要求分類器で拡張することにより,AIエージェントによるシミュレーションデータ可視化における人間のドメイン知識を捉えるソフトウェアエンジニアリングフレームワークを提案する。
12の評価器を備えた複数のエンジニアリングドメインにまたがる5つのシナリオを対象とした評価では、206%のアウトプット品質の向上が示され、私たちのエージェントは、すべてのケースでエキスパートレベルの評価を、ベースラインの貧弱なパフォーマンスに対して達成し、より優れたコード品質を低分散で維持しています。
ビジュアライゼーション生成のための自動エージェントベースシステムと、人間のドメイン知識を体系的に把握し、暗黙的な専門家知識をAIエージェントに体系化するための検証済みフレームワーク。
関連論文リスト
- Let the Barbarians In: How AI Can Accelerate Systems Performance Research [80.43506848683633]
我々は、この繰り返しサイクルを、AI駆動システム研究の生成、評価、洗練のサイクルと呼ぶ。
我々はADRSが生成するソリューションが人間の最先端の設計に適合し、さらに優れることを示した。
論文 参考訳(メタデータ) (2025-12-16T18:51:23Z) - Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.895981259683]
汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:11:31Z) - Can AI Master Econometrics? Evidence from Econometrics AI Agent on Expert-Level Tasks [9.52446148818128]
オープンソースのMetaGPTフレームワーク上に構築された「計量AIエージェント」を開発した。
本発明のエージェントは,(1)エコノメトリタスクを戦略的に計画し,(2)コードの生成と実行,(3)堅牢性向上のためのエラーベースのリフレクション,(4)多ラウンド会話による反復的洗練,といった優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-01T06:34:42Z) - On the Evaluation of Engineering Artificial General Intelligence [5.802869598386355]
本稿では,工学的汎用人工知能(eAGI)エージェントを評価するための枠組みを提案する。
我々はeAGIを人工知能(AGI)の専門化と考えている。
eAGIエージェントは、事実とメソッドの背景知識(リコールと検索)のユニークなブレンドを持つべきである。
論文 参考訳(メタデータ) (2025-05-15T18:52:47Z) - Leveraging Multi-AI Agents for Cross-Domain Knowledge Discovery [0.0]
本研究では,マルチAIエージェントの展開によるドメイン間知識発見への新たなアプローチを提案する。
本研究は,知識ギャップの特定とブリッジングにおいて,ドメイン固有マルチAIエージェントシステムの優れた能力を示すものである。
論文 参考訳(メタデータ) (2024-04-12T14:50:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。