論文の概要: How Do AI Agents Do Human Work? Comparing AI and Human Workflows Across Diverse Occupations
- arxiv url: http://arxiv.org/abs/2510.22780v1
- Date: Sun, 26 Oct 2025 18:10:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.364298
- Title: How Do AI Agents Do Human Work? Comparing AI and Human Workflows Across Diverse Occupations
- Title(参考訳): AIエージェントはヒューマンワークをどのように行うか? さまざまな作業におけるAIとヒューマンワークフローの比較
- Authors: Zora Zhiruo Wang, Yijia Shao, Omar Shaikh, Daniel Fried, Graham Neubig, Diyi Yang,
- Abstract要約: エージェントが人間とエージェントの労働者の直接比較を初めて提示することで、エージェントがどのように人間の仕事をするかを考察する。
結果が88.3%速く、コストが90.4-96.2%低いことが判明した。
- 参考スコア(独自算出の注目度): 112.57167042285437
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: AI agents are continually optimized for tasks related to human work, such as software engineering and professional writing, signaling a pressing trend with significant impacts on the human workforce. However, these agent developments have often not been grounded in a clear understanding of how humans execute work, to reveal what expertise agents possess and the roles they can play in diverse workflows. In this work, we study how agents do human work by presenting the first direct comparison of human and agent workers across multiple essential work-related skills: data analysis, engineering, computation, writing, and design. To better understand and compare heterogeneous computer-use activities of workers, we introduce a scalable toolkit to induce interpretable, structured workflows from either human or agent computer-use activities. Using such induced workflows, we compare how humans and agents perform the same tasks and find that: (1) While agents exhibit promise in their alignment to human workflows, they take an overwhelmingly programmatic approach across all work domains, even for open-ended, visually dependent tasks like design, creating a contrast with the UI-centric methods typically used by humans. (2) Agents produce work of inferior quality, yet often mask their deficiencies via data fabrication and misuse of advanced tools. (3) Nonetheless, agents deliver results 88.3% faster and cost 90.4-96.2% less than humans, highlighting the potential for enabling efficient collaboration by delegating easily programmable tasks to agents.
- Abstract(参考訳): AIエージェントは、ソフトウェアエンジニアリングやプロフェッショナルな執筆など、人間の作業に関連するタスクに対して継続的に最適化されており、人的労働力に大きな影響を与える、押し寄せる傾向を示している。
しかしながら、これらのエージェントの開発は、人間がどのように仕事をするかを明確に理解し、どんな専門的エージェントが持つか、そして様々なワークフローで果たすことができる役割を明らかにするために、しばしば基礎にされていない。
本研究では,データ分析,工学,計算,書面,設計など,複数の重要な業務関連スキルに対して,人間とエージェントの労働者の直接比較を初めて提示することによって,エージェントがどのように人間の作業を行うかを検討する。
作業者の異種コンピュータ利用活動をよりよく理解し、比較するために、人間またはエージェントのコンピュータ利用活動から解釈可能で構造化されたワークフローを誘導するスケーラブルなツールキットを導入する。
1) エージェントは、人間のワークフローとの整合性を示す一方で、設計のようなオープンな視覚的に依存したタスクであっても、すべての作業領域にわたって圧倒的にプログラム的なアプローチを取り、一般的に人間が使用するUI中心の手法とは対照的に作成します。
2) エージェントは, 品質が劣る作業を行うが, データ作成や高度なツールの誤用により, 欠点を隠蔽することが多い。
(3)しかしながら、エージェントは結果が88.3%速く、コストは90.4-96.2%も人間より低く、簡単にプログラム可能なタスクをエージェントに委譲することで効率的なコラボレーションを可能にする可能性を強調している。
関連論文リスト
- Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [60.04362496037186]
本研究は,コーディングエージェントと開発者インタラクションを制御した最初の研究である。
我々は,2つの主要な協調型およびエージェント型符号化アシスタントの評価を行った。
結果から,エージェントはコピロトを超える方法で開発者を支援することができることがわかった。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - Algorithmic Prompt Generation for Diverse Human-like Teaming and Communication with Large Language Models [14.45823275027527]
品質多様性(QD)最適化は、多様な強化学習(RL)エージェントの振る舞いを生成することができる。
我々はまず、人間-物体実験を通して、人間がこの領域で様々な協調行動とコミュニケーション行動を示すことを示す。
そして、我々の手法は、人間のチームデータからトレンドを効果的に再現し、観察できない振る舞いを捉えることができることを示す。
論文 参考訳(メタデータ) (2025-04-04T23:09:40Z) - Human-AI Collaboration: Trade-offs Between Performance and Preferences [6.521033978692547]
人間の行動に配慮したエージェントは、純粋にパフォーマンスを最大化するエージェントよりも好まれることを示す。
我々は、不平等-逆転効果が人間の選択の原動力であることの証拠を見つけ、人々がチームへの有意義な貢献を可能にする協力的なエージェントを好むことを示唆している。
論文 参考訳(メタデータ) (2025-02-28T23:50:14Z) - TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [55.03911355902567]
我々は、デジタルワーカーと同じような方法で世界と対話するAIエージェントを評価するためのベンチマークであるTheAgentCompanyを紹介する。
最も競争力のあるエージェントは、タスクの30%を自律的に完了させることができる。
これは、実際の職場の設定でLMエージェントをシミュレートすることで、タスク自動化に関する微妙な絵を描く。
論文 参考訳(メタデータ) (2024-12-18T18:55:40Z) - Two Heads Are Better Than One: Collaborative LLM Embodied Agents for Human-Robot Interaction [1.6574413179773757]
大規模言語モデル(LLM)は、自然言語コマンドを解釈するために、その膨大な理解を活用できなければならない。
しかし、これらのモデルは幻覚に悩まされ、安全上の問題やタスクからの逸脱を引き起こす可能性がある。
本研究では、一つの独立したAIエージェントに対して複数のコラボレーティブAIシステムがテストされ、他のドメインの成功が人間とロボットのインタラクション性能の改善につながるかどうかを判定した。
論文 参考訳(メタデータ) (2024-11-23T02:47:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。