論文の概要: LLM-Based Data Science Agents: A Survey of Capabilities, Challenges, and Future Directions
- arxiv url: http://arxiv.org/abs/2510.04023v1
- Date: Sun, 05 Oct 2025 04:04:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.40566
- Title: LLM-Based Data Science Agents: A Survey of Capabilities, Challenges, and Future Directions
- Title(参考訳): LLMに基づくデータサイエンスエージェント:能力,課題,今後の方向性に関する調査
- Authors: Mizanur Rahman, Amran Bhuiyan, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, Ridwan Mahbub, Ahmed Masry, Shafiq Joty, Enamul Hoque,
- Abstract要約: この調査は、データサイエンスエージェントのライフサイクルに整合した最初の包括的分類である。
エンド・ツー・エンドのデータサイエンス・プロセスの6段階に45のシステムを解析する。
それぞれのステージにおける強みと制限を強調し、新たなベンチマークと評価プラクティスをレビューします。
- 参考スコア(独自算出の注目度): 46.70253280146778
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in large language models (LLMs) have enabled a new class of AI agents that automate multiple stages of the data science workflow by integrating planning, tool use, and multimodal reasoning across text, code, tables, and visuals. This survey presents the first comprehensive, lifecycle-aligned taxonomy of data science agents, systematically analyzing and mapping forty-five systems onto the six stages of the end-to-end data science process: business understanding and data acquisition, exploratory analysis and visualization, feature engineering, model building and selection, interpretation and explanation, and deployment and monitoring. In addition to lifecycle coverage, we annotate each agent along five cross-cutting design dimensions: reasoning and planning style, modality integration, tool orchestration depth, learning and alignment methods, and trust, safety, and governance mechanisms. Beyond classification, we provide a critical synthesis of agent capabilities, highlight strengths and limitations at each stage, and review emerging benchmarks and evaluation practices. Our analysis identifies three key trends: most systems emphasize exploratory analysis, visualization, and modeling while neglecting business understanding, deployment, and monitoring; multimodal reasoning and tool orchestration remain unresolved challenges; and over 90% lack explicit trust and safety mechanisms. We conclude by outlining open challenges in alignment stability, explainability, governance, and robust evaluation frameworks, and propose future research directions to guide the development of robust, trustworthy, low-latency, transparent, and broadly accessible data science agents.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩により、テキスト、コード、テーブル、ビジュアルにわたる計画、ツールの使用、マルチモーダル推論を統合することで、データサイエンスワークフローの複数のステージを自動化する新しいAIエージェントのクラスが実現された。
この調査では、ビジネス理解とデータ取得、探索的分析と可視化、機能工学、モデル構築と選択、解釈と説明、デプロイメントと監視の6段階に、45のシステムを体系的に分析し、マッピングする、データサイエンスエージェントのライフサイクル整合型分類を初めて提示する。
ライフサイクルカバレッジに加えて、推論と計画スタイル、モダリティ統合、ツールオーケストレーションの深さ、学習とアライメントの方法、信頼、安全、ガバナンスのメカニズムの5つの横断的な設計側面に沿って、各エージェントに注釈を付けます。
分類以外にも、エージェント機能のクリティカルな合成、各ステージにおける強みと制限の強調、新たなベンチマークと評価プラクティスのレビューを提供しています。
多くのシステムは、ビジネス理解、デプロイメント、監視を無視しながら探索的分析、可視化、モデリングを強調しており、マルチモーダル推論とツールオーケストレーションは未解決の課題であり、90%以上が明確な信頼と安全メカニズムを欠いている。
我々は、安定性、説明可能性、ガバナンス、堅牢な評価フレームワークの整合性に関するオープンな課題を概説し、堅牢で信頼性が高く、低レイテンシで透明で、広くアクセス可能なデータサイエンスエージェントの開発を導くための今後の研究方向性を提案する。
関連論文リスト
- LLM/Agent-as-Data-Analyst: A Survey [51.19078438787228]
大規模言語モデル(LLM)とデータ分析のためのエージェント技術は、学術と産業の両方に大きな影響を与えている。
この技術進化は、インテリジェントなデータ分析エージェントのための5つの重要な設計目標、すなわちセマンティック・アウェア・デザイン、ハイブリッド統合、自律パイプライン、ツールの拡張されたモダリティ、オープンワールドタスクのサポートをさらに強化する。
論文 参考訳(メタデータ) (2025-09-28T17:31:38Z) - AI Agentic Programming: A Survey of Techniques, Challenges, and Opportunities [8.086360127362815]
大規模言語モデル(LLM)ベースのコーディングエージェントは、コンパイラ、デバッガ、バージョン管理システムなどのツールを自律的に計画し、実行し、操作する。
従来のコード生成とは異なり、これらのエージェントは目標を分解し、多段階プロセスをコーディネートし、フィードバックに基づいて適応し、ソフトウェア開発のプラクティスを再構築する。
論文 参考訳(メタデータ) (2025-08-15T00:14:31Z) - A Survey of AI for Materials Science: Foundation Models, LLM Agents, Datasets, and Tools [15.928285656168422]
ファンデーションモデル(FM)は、科学的発見のためにスケーラブルで汎用的でマルチモーダルなAIシステムを実現する。
この調査は、この成長分野をサポートする基盤モデル、エージェントシステム、データセット、計算ツールの包括的概要を提供する。
論文 参考訳(メタデータ) (2025-06-25T18:10:30Z) - Large Language Models Meet Stance Detection: A Survey of Tasks, Methods, Applications, Challenges and Future Directions [0.37865171120254354]
スタンス検出は、ソーシャルメディア、ニュース記事、オンラインレビューなど、さまざまなプラットフォームにわたる主観的コンテンツを理解するために不可欠である。
大規模言語モデル(LLM)の最近の進歩は、新しい能力を導入して姿勢検出に革命をもたらした。
本稿では3つの重要な側面に沿って構築されたLCMに基づく姿勢検出手法について,新しい分類法を提案する。
スタンス検出、政治分析、公衆衛生モニタリング、ソーシャルメディアのモデレーションにおける主要な応用について論じる。
論文 参考訳(メタデータ) (2025-05-13T11:47:49Z) - Survey on Evaluation of LLM-based Agents [28.91672694491855]
LLMベースのエージェントの出現は、AIのパラダイムシフトを表している。
本稿では,これらのエージェントに対する評価手法に関する総合的な調査を初めて実施する。
論文 参考訳(メタデータ) (2025-03-20T17:59:23Z) - Deep Learning, Machine Learning, Advancing Big Data Analytics and Management [26.911181864764117]
人工知能、機械学習、ディープラーニングの進歩は、ビッグデータ分析と管理の変革を触媒している。
本研究は,これらの技術の理論的基礎,方法論的進歩,実践的実装について考察する。
研究者、実践家、データ愛好家は、現代のデータ分析の複雑さをナビゲートするツールを利用できる。
論文 参考訳(メタデータ) (2024-12-03T05:59:34Z) - The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources [100.23208165760114]
ファンデーションモデル開発は、急速に成長するコントリビュータ、科学者、アプリケーションを引き付けている。
責任ある開発プラクティスを形成するために、我々はFoundation Model Development Cheatsheetを紹介します。
論文 参考訳(メタデータ) (2024-06-24T15:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。