論文の概要: Queue & AI: When Faster Tasks Slow Down the Workflow
- arxiv url: http://arxiv.org/abs/2605.27202v1
- Date: Tue, 26 May 2026 15:57:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.396189
- Title: Queue & AI: When Faster Tasks Slow Down the Workflow
- Title(参考訳): Queue & AI: タスクの高速化がワークフローを遅くする
- Authors: Silvia Bartolucci, Pierpaolo Vivo,
- Abstract要約: カスタマーサービス、書き込み、ソフトウェア開発、コンサルティングオペレーションにAIツールが配置されることで、タスク当たりの生産性が大幅に向上することが報告されている。
このような平均ベースのメトリクスは、タスクが蓄積され、人間の注意を弱めるために競合するAIの影響を誤って表すことができる、と私たちは主張する。
- 参考スコア(独自算出の注目度): 2.89908994976586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quantifying the workplace productivity effects of Generative Artificial Intelligence is now central to economics, management, and public policy. The deployment of AI tools in customer service, writing, software development, and consulting operations has been reported to generate large per-task productivity gains, typically measured as tasks completed per worker-hour or reductions in mean handle time. We argue that such mean-based metrics can misrepresent AI's effects in workflows where tasks accumulate and compete for scarce human attention. AI assistance can generate a deceptive productivity signature: average completion times fall because AI tools typically supply a fast first draft, yet workflow-level performance deteriorates when a subset of AI errors escapes review and returns as costly downstream rework. We call this divergence between mean task speed and system-level delay the variance wedge. Depending on the operational parameters, the most time-efficient way to complete a workflow may undergo a transition between two task-processing regimes, a fully AI-assisted and a fully manual one. We formalize the mechanism as a queueing model and derive two main implications analytically. First, under congestion, reviewers rationally raise the risk threshold for checking AI outputs, reducing scrutiny precisely when it would matter the most. Second, AI assistance can stabilize an overloaded workflow only when (i) the fraction of tasks handled by AI exceeds a critical threshold, and (ii) the human attention required for review and expected rework is lower than the attention for manual completion, a requirement substantially more stringent than faster draft generation. These results suggest that AI deployment should be evaluated not only by average task speed, but by its overall effects on congestion, rework, and the robustness of human oversight under load.
- Abstract(参考訳): ジェネレーティブ・人工知能の職場生産性効果の定量化は、現在では経済、経営、公共政策の中心となっている。
カスタマーサービス、書き込み、ソフトウェア開発、コンサルティングオペレーションにおけるAIツールのデプロイは、通常、作業時間当たりのタスクや平均ハンドルタイムの削減として測定される、タスク毎の生産性の大きな向上をもたらすと報告されている。
このような平均ベースのメトリクスは、タスクが蓄積され、人間の注意が不足しているワークフローにおいて、AIの効果を誤って表現する可能性がある、と私たちは主張する。
AIツールは通常、高速なファーストドラフトを提供するが、ワークフローレベルのパフォーマンスは、AIエラーのサブセットがレビューを逃れて、コストのかかるダウンストリームのリワークとして戻ってくると低下する。
これを平均タスク速度とシステムレベル遅延の分散と呼ぶ。
運用パラメータによっては、ワークフローを完了するための最も時間効率のよい方法は、2つのタスク処理レシスタンス、完全なAIアシストと完全に手作業で移行する可能性がある。
待ち行列モデルとして機構を定式化し、2つの主要な意味を解析的に導出する。
まず、混雑下では、レビュアーはAI出力をチェックするためのリスク閾値を合理的に上昇させ、最も重要かどうかの精査を正確に削減する。
第二に、AIアシスタントは過負荷のワークフローを、一度だけ安定化できる
i)AIによって処理されるタスクのごく一部が臨界しきい値を超え、
(II) レビューや再作業に必要な人的注意は手作業の注意よりも低く, より高速なドラフト生成よりもかなり厳密な要件である。
これらの結果は、AIデプロイメントは、平均的なタスク速度だけでなく、渋滞、再作業、負荷下での人間の監視の堅牢性に対する全体的な影響によって評価されるべきであることを示唆している。
関連論文リスト
- EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - AgentIF-OneDay: A Task-level Instruction-Following Benchmark for General AI Agents in Daily Scenarios [49.90735676070039]
持続時間と複雑さが増大するタスクを効果的に処理するAIエージェントの能力は、成長を続けている。
エージェントタスクの多様性に十分対処することなく,タスクの難易度の向上を優先している。
本稿では,自然言語命令とAIエージェントを多種多様な日常タスクに活用できるかどうかを判定するエージェントIF-OneDayを提案する。
論文 参考訳(メタデータ) (2026-01-28T13:49:18Z) - AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development [12.50615284537175]
大規模言語モデル(LLM)ベースのコーディングエージェントは、プルリクエストの生成とマージを行う自律的なコントリビュータとして機能するようになっている。
本稿では,オープンソースリポジトリにおけるエージェント導入の経時的因果関係について検討する。
論文 参考訳(メタデータ) (2026-01-20T04:51:56Z) - AI Agents as Universal Task Solvers [94.49762121230042]
我々は,過去のデータを用いて,普遍的な解法が達成できる最適なスピードアップが,アルゴリズム情報と密接な関係があることを示す。
我々は、推論モデルをスケールする際に最適化する重要な量は時間であり、学習における重要な役割は、これまでは間接的にのみ考慮されてきたと論じている。
論文 参考訳(メタデータ) (2025-10-14T02:17:54Z) - ProRefine: Inference-Time Prompt Refinement with Textual Feedback [10.679248386926703]
AgenticThoughtは、複数のAIエージェントが協力して推論や計画といった複雑なタスクを遂行する。
本稿では,LLMのエージェントループを用いてテキストフィードバックを生成し,適用する,革新的な推論時間最適化手法ProRefineを紹介する。
論文 参考訳(メタデータ) (2025-06-05T17:52:30Z) - AI2Agent: An End-to-End Framework for Deploying AI Projects as Autonomous Agents [15.802600809497097]
本稿では、ガイドライン駆動実行を通じてAIプロジェクトのデプロイメントを自動化するエンドツーエンドフレームワークであるAI2Agentを紹介する。
我々は、TTS、テキスト・ツー・イメージ生成、画像編集、その他のAIアプリケーションをカバーする、30のAIデプロイメントケースの実験を行った。
その結果、AI2Agentはデプロイメント時間を大幅に短縮し、成功率を向上させることがわかった。
論文 参考訳(メタデータ) (2025-03-31T10:58:34Z) - General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。
私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。
私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文 参考訳(メタデータ) (2025-03-09T01:13:56Z) - Adaptation of XAI to Auto-tuning for Numerical Libraries [0.0]
説明可能なAI(XAI)技術は、AIモデル開発の合理化と、ユーザへのAI出力の説明の負担軽減を目的として、注目を集めている。
本研究は,2つの異なるプロセスに統合されたAIモデルのXAIに着目し,数値計算を行う。
論文 参考訳(メタデータ) (2024-05-12T09:00:56Z) - The Foundations of Computational Management: A Systematic Approach to
Task Automation for the Integration of Artificial Intelligence into Existing
Workflows [55.2480439325792]
本稿では,タスク自動化の体系的アプローチである計算管理を紹介する。
この記事では、ワークフロー内でAIを実装するプロセスを開始するための、ステップバイステップの手順を3つ紹介する。
論文 参考訳(メタデータ) (2024-02-07T01:45:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。