論文の概要: Can Agentic AI Match the Performance of Human Data Scientists?
- arxiv url: http://arxiv.org/abs/2512.20959v1
- Date: Wed, 24 Dec 2025 05:31:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.68934
- Title: Can Agentic AI Match the Performance of Human Data Scientists?
- Title(参考訳): エージェントAIは人間のデータサイエンティストのパフォーマンスにマッチできるか?
- Authors: An Luo, Jin Du, Fangqiao Tian, Xun Xian, Robert Specht, Ganghua Wang, Xuan Bi, Charles Fleming, Jayanth Srinivasa, Ashish Kundu, Mingyi Hong, Jie Ding,
- Abstract要約: 大規模言語モデル(LLM)は、非常に自動化されたデータサイエンスを持つ。
これらのエージェントAIシステムは、人間のデータサイエンティストのパフォーマンスに本当にマッチできるか?
ジェネリック分析ワークフローに依存するエージェントAIは、ドメイン固有の洞察を使用するメソッドに劣っていることを示す。
- 参考スコア(独自算出の注目度): 27.236034079837044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data science plays a critical role in transforming complex data into actionable insights across numerous domains. Recent developments in large language models (LLMs) have significantly automated data science workflows, but a fundamental question persists: Can these agentic AI systems truly match the performance of human data scientists who routinely leverage domain-specific knowledge? We explore this question by designing a prediction task where a crucial latent variable is hidden in relevant image data instead of tabular features. As a result, agentic AI that generates generic codes for modeling tabular data cannot perform well, while human experts could identify the important hidden variable using domain knowledge. We demonstrate this idea with a synthetic dataset for property insurance. Our experiments show that agentic AI that relies on generic analytics workflow falls short of methods that use domain-specific insights. This highlights a key limitation of the current agentic AI for data science and underscores the need for future research to develop agentic AI systems that can better recognize and incorporate domain knowledge.
- Abstract(参考訳): データサイエンスは、複雑なデータを多くの領域にわたって実行可能な洞察に変換する上で重要な役割を担います。
大規模言語モデル(LLM)の最近の開発では、データサイエンスのワークフローが大幅に自動化されているが、根本的な疑問が残る。
本稿では,有意な潜伏変数が有意な画像データに隠れているような予測タスクを設計し,その課題を考察する。
結果として、表データモデリングのための汎用コードを生成するエージェントAIは、人間の専門家がドメイン知識を使って重要な隠れ変数を識別するのに対して、うまく機能しない。
我々は、このアイデアを、資産保険のための合成データセットで実証する。
我々の実験によると、ジェネリック分析ワークフローに依存するエージェントAIは、ドメイン固有の洞察を使用するメソッドに劣っている。
これは、現在のデータサイエンスにおけるエージェントAIの重要な制限を強調し、ドメイン知識をよりよく認識し、組み込むエージェントAIシステムを開発するための将来の研究の必要性を強調している。
関連論文リスト
- What's the next frontier for Data-centric AI? Data Savvy Agents [71.76058707995398]
我々は、エージェントシステムの設計において、データに精通する能力が最優先すべきであると主張している。
本稿では,このビジョンを実現するための4つの重要な機能を提案する。プロアクティブデータ取得,ソフシフィケートデータ処理,インタラクティブテストデータ合成,連続的適応。
論文 参考訳(メタデータ) (2025-11-02T17:09:29Z) - Autonomous Data Agents: A New Opportunity for Smart Data [50.02229219403014]
DataAgentsは、自律的なデータから知識システムへのパラダイムシフトを表している、とReportは主張する。
DataAgentsは、複雑で非構造化されたデータをコヒーレントで行動可能な知識に変換する。
エージェントAIとデータ・トゥ・ナレッジシステムの収束が重要なトレンドとなっている理由を最初に検討する。
論文 参考訳(メタデータ) (2025-09-23T06:46:41Z) - DatasetResearch: Benchmarking Agent Systems for Demand-Driven Dataset Discovery [26.388978716803464]
AIエージェントは、通常の検索を超越して、特定のユーザ要求を満たすデータセットを体系的に検出できるだろうか?
我々のベンチマークと包括的な分析は、次世代の自己改善型AIシステムの基礎を提供する。
論文 参考訳(メタデータ) (2025-08-09T12:15:08Z) - AI, Humans, and Data Science: Optimizing Roles Across Workflows and the Workforce [0.0]
我々は、分析、生成、エージェントAIの可能性と限界を考慮し、データサイエンティストを増強したり、伝統的に人間のアナリストや研究者によってなされたタスクを引き受ける。
従来の調査分析が問題になったのは、統計ソフトウェアの使用が簡単になったことで、研究者が完全に理解できなかった分析を行えなくなった時だった。
論文 参考訳(メタデータ) (2025-07-15T17:59:06Z) - Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.49715661395294]
データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文 参考訳(メタデータ) (2025-06-22T12:59:12Z) - AI-in-the-loop: The future of biomedical visual analytics applications in the era of AI [3.0942901747200975]
データ分析におけるAIの大規模開発は、将来のデータ視覚化とビジュアル分析をどう形成するか?
ますます強力なAIの文脈における機会、オープンな課題、脅威とは何か?
我々は、バイオメディカルビジュアライゼーションを研究分野として変革するAIの可能性を強調した。
論文 参考訳(メタデータ) (2024-12-20T13:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。