論文の概要: Empowering Real-World: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents
- arxiv url: http://arxiv.org/abs/2510.17491v1
- Date: Mon, 20 Oct 2025 12:46:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:12.049896
- Title: Empowering Real-World: A Survey on the Technology, Practice, and Evaluation of LLM-driven Industry Agents
- Title(参考訳): LLM駆動型産業エージェントの技術, 実践, 評価に関する実態調査
- Authors: Yihong Tang, Kehai Chen, Liang Yue, Jinxin Fan, Caishen Zhou, Xiaoguang Li, Yuyang Zhang, Mingming Zhao, Shixiong Kai, Kaiyang Guo, Xingshan Zeng, Wenjing Cun, Lifeng Shang, Min Zhang,
- Abstract要約: 本稿では,大規模言語モデル(LLM)に基づく産業エージェントの技術,応用,評価手法を体系的にレビューする。
エージェント能力の進歩を支える3つの重要な技術柱として,記憶,計画,ツール利用について検討する。
本稿では,デジタル工学,科学的発見,具体的インテリジェンス,協調ビジネス実行,複雑なシステムシミュレーションといった実世界の領域における産業エージェントの応用の概要について述べる。
- 参考スコア(独自算出の注目度): 63.03252293761656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise of large language models (LLMs), LLM agents capable of autonomous reasoning, planning, and executing complex tasks have become a frontier in artificial intelligence. However, how to translate the research on general agents into productivity that drives industry transformations remains a significant challenge. To address this, this paper systematically reviews the technologies, applications, and evaluation methods of industry agents based on LLMs. Using an industry agent capability maturity framework, it outlines the evolution of agents in industry applications, from "process execution systems" to "adaptive social systems." First, we examine the three key technological pillars that support the advancement of agent capabilities: Memory, Planning, and Tool Use. We discuss how these technologies evolve from supporting simple tasks in their early forms to enabling complex autonomous systems and collective intelligence in more advanced forms. Then, we provide an overview of the application of industry agents in real-world domains such as digital engineering, scientific discovery, embodied intelligence, collaborative business execution, and complex system simulation. Additionally, this paper reviews the evaluation benchmarks and methods for both fundamental and specialized capabilities, identifying the challenges existing evaluation systems face regarding authenticity, safety, and industry specificity. Finally, we focus on the practical challenges faced by industry agents, exploring their capability boundaries, developmental potential, and governance issues in various scenarios, while providing insights into future directions. By combining technological evolution with industry practices, this review aims to clarify the current state and offer a clear roadmap and theoretical foundation for understanding and building the next generation of industry agents.
- Abstract(参考訳): 大規模言語モデル(LLM)の台頭により、自律的な推論、計画、実行が可能なLLMエージェントが人工知能のフロンティアとなった。
しかし、一般エージェントの研究を、業界変革を駆動する生産性にどのように翻訳するかは、依然として大きな課題である。
そこで本研究では,LLMに基づく産業エージェントの技術,応用,評価手法を体系的にレビューする。
産業エージェント能力成熟度フレームワークを用いて、プロセス実行システムから適応型社会システムまで、産業アプリケーションにおけるエージェントの進化を概説する。
まず,エージェントの能力向上を支える3つの重要な技術柱,記憶,計画,ツール利用について検討する。
これらの技術が、初期の状態での単純なタスクから、より高度な形で複雑な自律システムや集合知性を実現するまで、どのように進化していくかについて議論する。
次に,デジタル工学,科学的発見,インボディードインテリジェンス,協調ビジネス実行,複雑なシステムシミュレーションといった実世界の領域における産業エージェントの応用について概説する。
さらに,本論文では,既存の評価システムで直面する,信頼性,安全性,産業特異性に関する課題について,基礎的および専門的能力の両面での評価ベンチマークと手法について検討する。
最後に、業界エージェントが直面する現実的な課題に注目し、その能力境界、開発可能性、ガバナンスの問題について様々なシナリオで探求し、将来的な方向性について洞察を提供する。
技術革新と産業の実践を組み合わせることで、このレビューは現状を明確にし、次世代の産業エージェントの理解と構築のための明確なロードマップと理論的基盤を提供することを目的としている。
関連論文リスト
- A Survey on Agentic Multimodal Large Language Models [84.18778056010629]
エージェントマルチモーダル大言語モデル(Agentic MLLMs)に関する総合的な調査を行う。
我々は,エージェントMLLMの新たなパラダイムを探求し,その概念的基盤を明確にし,従来のMLLMエージェントとの特徴を区別する。
コミュニティのためのこの分野の研究をさらに加速するため、エージェントMLLMを開発するためのオープンソースのトレーニングフレームワーク、トレーニングおよび評価データセットをコンパイルする。
論文 参考訳(メタデータ) (2025-10-13T04:07:01Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - AI Agentic Programming: A Survey of Techniques, Challenges, and Opportunities [8.086360127362815]
大規模言語モデル(LLM)ベースのコーディングエージェントは、コンパイラ、デバッガ、バージョン管理システムなどのツールを自律的に計画し、実行し、操作する。
従来のコード生成とは異なり、これらのエージェントは目標を分解し、多段階プロセスをコーディネートし、フィードバックに基づいて適応し、ソフトウェア開発のプラクティスを再構築する。
論文 参考訳(メタデータ) (2025-08-15T00:14:31Z) - A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems [53.37728204835912]
既存のAIシステムは、デプロイ後も静的な手作業による構成に依存している。
近年,インタラクションデータと環境フィードバックに基づいてエージェントシステムを自動拡張するエージェント進化手法が研究されている。
この調査は、自己進化型AIエージェントの体系的な理解を研究者や実践者に提供することを目的としている。
論文 参考訳(メタデータ) (2025-08-10T16:07:32Z) - A Survey on Code Generation with LLM-based Agents [61.474191493322415]
大規模言語モデル(LLM)を利用したコード生成エージェントは、ソフトウェア開発パラダイムに革命をもたらしている。
LLMは3つのコア特徴によって特徴づけられる。
本稿では,LLMに基づくコード生成エージェントの分野を体系的に調査する。
論文 参考訳(メタデータ) (2025-07-31T18:17:36Z) - Rethinking industrial artificial intelligence: a unified foundation framework [0.32885740436059047]
産業人工知能(AI)の最近の進歩は、よりスマートな製造、予測保守、インテリジェントな意思決定を推進し、産業を変革している。
既存のアプローチは、ドメイン知識、データ、モデルを体系的に統合することの重要性を見越しながら、主にアルゴリズムとモデルに焦点を当てることが多い。
本稿では,従来の研究をレビューし,産業AIの役割を再考し,統一産業AI基盤フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-02T15:05:32Z) - AI Agents: Evolution, Architecture, and Real-World Applications [0.0]
本稿は、AIエージェントの進化、アーキテクチャ、実践的応用を、AIエージェントの初期から、認識、計画、ツール使用のための専用のモジュールを備えた大規模言語モデルを統合した近代的なシステムへ移行する。
論文 参考訳(メタデータ) (2025-03-16T23:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。