論文の概要: Agentic AI in Industry: Adoption Level and Deployment Barriers
- arxiv url: http://arxiv.org/abs/2605.14675v1
- Date: Thu, 14 May 2026 10:34:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.778964
- Title: Agentic AI in Industry: Adoption Level and Deployment Barriers
- Title(参考訳): 産業におけるエージェントAI - 採用レベルとデプロイメントバリア
- Authors: Spyridon Alvanakis Apostolou, Jan Bosch, Helena Holmström Olsson,
- Abstract要約: 本研究は、現在12社のエージェントAI採用状況の特徴である。
レベル1(AIアシスタント)7社、レベル2(AI補償)4社、レベル3(Multi-Agent Orchestration)1社
- 参考スコア(独自算出の注目度): 4.241377338556251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic AI systems are entering software engineering workflows, yet empirical evidence on how industrial organizations actually adopt them remains sparse. We present a qualitative interview study with sixteen practitioners across twelve companies of varying size and domain. This study characterizes the current agentic AI adoption state of these companies, employing a six-level maturity framework adapted from established AI-driven organizations. The findings reveal that seven companies operate at Level~1 (AI Assistants), four companies at Level~2 (AI Compensators), and only one in Level~3 (Multi-Agent Orchestration), with large and safety-regulated organizations among the most advanced adopters. The primary finding is a capability-deployment verification gap, four companies demonstrated higher-level experimental AI capabilities but cannot integrate them into production workflows because adequate output verification mechanisms are absent, leaving human-in-the-loop as the only trusted verification mechanism. This gap is shaped by four recurring barriers: context window of LLMs constraints especially when diverse knowledge aggregation is needed, under-performance on proprietary programming languages and protocols, non-determinism incompatible with qualification standards, and data confidentiality concerns. Two interdependent dimensions of this gap emerge from these findings (information asymmetry and qualification absence) framing a core open problem for industrial agentic integration.
- Abstract(参考訳): エージェントAIシステムは、ソフトウェアエンジニアリングのワークフローに入りつつあるが、産業組織が実際にそれを採用する方法に関する実証的な証拠は、まだ少ないままだ。
さまざまな規模・領域の企業12社を対象に16人の実践者を対象に質的なインタビューを行った。
この研究は、既存のAI駆動組織から適応した6段階の成熟度フレームワークを用いて、これらの企業の現在のエージェントAI採用状況を特徴付けている。
その結果、レベル~1(AIアシスタント)の7社、レベル~2(AI補償者)の4社、レベル~3(Multi-Agent Orchestration)の1社のみが、大規模で安全に規制された組織が、最も先進的な採用企業であることがわかった。
4つの企業がハイレベルな実験的なAI機能をデモしたが、適切な出力検証メカニズムが欠如しているため、運用ワークフローに統合できない。
LLMのコンテキストウィンドウは、特に多様な知識集約が必要な場合の制約、プロプライエタリなプログラミング言語やプロトコルでの低パフォーマンス、資格基準に適合しない非決定性、データ機密性の懸念である。
このギャップの2つの相互依存次元は、これらの発見(情報非対称性と資格欠如)から出現し、工業的エージェント統合のコアオープン問題に対処する。
関連論文リスト
- Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems [65.90791804095561]
マルチエージェントシステムは、特殊エージェント間の構造化された協調を通じてこの問題に対処するが、より厳密な調整は、あまり検討されていないリスクを増幅する。
既存の調査では、個々のエージェント能力、マルチエージェントのコラボレーション、エージェントの自己進化を別々にカバーしている。
この調査は4つの因果関係のあるステージを中心にまとめられた統一されたレビューを提供する。これはLIFEの進展(Lay the capabilities foundation)、協力によるエージェントの統合、帰属による障害の発見、自律的な自己改善によるEvolveである。
論文 参考訳(メタデータ) (2026-05-14T14:36:13Z) - OccuBench: Evaluating AI Agents on Real-World Professional Tasks via Language Environment Simulation [57.505743202759646]
OccuBenchは10の業界カテゴリと65の専門ドメインにわたる100の現実のプロフェッショナルタスクシナリオをカバーするベンチマークである。
我々のマルチエージェント合成パイプラインは, 可溶性, 校正困難, 文書基底の多様性を保証した評価インスタンスを自動生成する。
論文 参考訳(メタデータ) (2026-04-13T00:27:32Z) - IACDM: Interactive Adversarial Convergence Development Methodology -- A Structured Framework for AI-Assisted Software Development [0.0]
この記事では、障害は構造的な原因 – 検証のギャップ – を共有している、と論じる。
我々は,外部検証エージェントによる検証ギャップに対処するために,構造化された8フェーズフレームワークであるIACDMを提案する。
論文 参考訳(メタデータ) (2026-03-31T09:48:09Z) - Agentic AI in Engineering and Manufacturing: Industry Perspectives on Utility, Adoption, Challenges, and Opportunities [3.312613459249274]
この研究は、AI、特にエージェントシステムがエンジニアリングと製造にどのように採用されているか、今日の価値、より広範なデプロイメントに必要なものについて調べる。
近い将来のAIは、構造化された、反復的で、データ集約的な作業を中心にクラスタを獲得し、高い価値のエージェントは、ツールをまたいだマルチステップ作業のオーケストレーションから得ます。
採用は、断片化やマシン不フレンドリなデータ、厳格なセキュリティと規制要件、限定的なAPIアクセス可能なレガシツールよりも、モデル能力によって制限される。
論文 参考訳(メタデータ) (2026-03-19T22:36:34Z) - Toward Third-Party Assurance of AI Systems: Design Requirements, Prototype, and Early Testing [16.53658640529767]
我々は,AI評価のギャップに対処する,サードパーティのAI保証フレームワークを導入する。
我々は、利害の衝突を防ぎ、プロセスの信頼性と説明責任を確保するために、第三者の保証に焦点を当てる。
私たちの発見は、AI保証フレームワークが健全で包括的で、さまざまな組織的コンテキストで使用できるという、初期の証拠を示しています。
論文 参考訳(メタデータ) (2026-01-30T00:37:12Z) - Making LLMs Reliable When It Matters Most: A Five-Layer Architecture for High-Stakes Decisions [51.56484100374058]
現在の大規模言語モデル(LLM)は、実行前にアウトプットをチェックできるが、不確実な結果を伴う高い戦略決定には信頼性が低い検証可能な領域で優れている。
このギャップは、人間と人工知能(AI)システムの相互認知バイアスによって引き起こされ、そのセクターにおける評価と投資の持続可能性の保証を脅かす。
本報告では、7つのフロンティアグレードLDMと3つの市場向けベンチャーヴィグネットの時間的圧力下での系統的質的評価から生まれた枠組みについて述べる。
論文 参考訳(メタデータ) (2025-11-10T22:24:21Z) - SWE-Compass: Towards Unified Evaluation of Agentic Coding Abilities for Large Language Models [59.90381306452982]
ソフトウェアエンジニアリングのための大規模言語モデル(LLM)の評価は、タスクカバレッジの狭さ、言語バイアス、現実世界の開発者との整合性の不足によって制限されている。
SWE-1は、不均一なコード関連評価を構造化および生産整合性のあるフレームワークに統合する包括的なベンチマークである。
SWE-は8つのタスクタイプ、8つのプログラミングシナリオ、10のプログラミング言語にまたがる。
論文 参考訳(メタデータ) (2025-11-07T18:01:32Z) - From MAS to MARS: Coordination Failures and Reasoning Trade-offs in Hierarchical Multi-Agent Robotic Systems within a Healthcare Scenario [3.5262044630932254]
マルチエージェントロボットシステム(MARS)は、物理的およびタスク関連の制約を統合することで、マルチエージェントシステム上に構築される。
高度なマルチエージェントフレームワークが利用可能であるにも関わらず、実際のロボットへのデプロイメントは制限されている。
論文 参考訳(メタデータ) (2025-08-06T17:54:10Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。