論文の概要: VDSAgents: A PCS-Guided Multi-Agent System for Veridical Data Science Automation
- arxiv url: http://arxiv.org/abs/2510.24339v1
- Date: Tue, 28 Oct 2025 12:07:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.103593
- Title: VDSAgents: A PCS-Guided Multi-Agent System for Veridical Data Science Automation
- Title(参考訳): VDSAgents: 検証データサイエンス自動化のためのPCS-Guided Multi-Agent System
- Authors: Yunxuan Jiang, Silan Hu, Xiaoning Wang, Yuanyuan Zhang, Xiangyu Chang,
- Abstract要約: 大規模言語モデル(LLM)は、自動システム設計のためのデータサイエンスにますます統合される。
本稿では,PCS(Predictability-Computability-Stability)の原則に基づくマルチエージェントシステムであるVDSAgentsを提案する。
VDSAgentsを、最先端のエンドツーエンドデータサイエンスシステムと比較し、様々な特徴を持つ9つのデータセット上で評価する。
- 参考スコア(独自算出の注目度): 11.521235834823301
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) become increasingly integrated into data science workflows for automated system design. However, these LLM-driven data science systems rely solely on the internal reasoning of LLMs, lacking guidance from scientific and theoretical principles. This limits their trustworthiness and robustness, especially when dealing with noisy and complex real-world datasets. This paper provides VDSAgents, a multi-agent system grounded in the Predictability-Computability-Stability (PCS) principles proposed in the Veridical Data Science (VDS) framework. Guided by PCS principles, the system implements a modular workflow for data cleaning, feature engineering, modeling, and evaluation. Each phase is handled by an elegant agent, incorporating perturbation analysis, unit testing, and model validation to ensure both functionality and scientific auditability. We evaluate VDSAgents on nine datasets with diverse characteristics, comparing it with state-of-the-art end-to-end data science systems, such as AutoKaggle and DataInterpreter, using DeepSeek-V3 and GPT-4o as backends. VDSAgents consistently outperforms the results of AutoKaggle and DataInterpreter, which validates the feasibility of embedding PCS principles into LLM-driven data science automation.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自動システム設計のためのデータサイエンスワークフローにますます統合される。
しかし、これらのLLM駆動型データサイエンスシステムは、科学と理論の原理からのガイダンスが欠如しているため、LSMの内部的推論にのみ依存している。
これにより、特にノイズの多い複雑な実世界のデータセットを扱う場合、信頼性と堅牢性が制限される。
本稿では,PCS(Predictability-Computability-Stability)の原則に基づくマルチエージェントシステムであるVDSAgentsを,VDS(Veridical Data Science)フレームワークで提案する。
PCSの原則によってガイドされたこのシステムは、データクリーニング、機能エンジニアリング、モデリング、評価のためのモジュラーワークフローを実装している。
各フェーズはエレガントなエージェントによって処理され、機能と科学的監査性の両方を保証するために摂動解析、単体テスト、モデル検証が組み込まれている。
我々は、DeepSeek-V3とGPT-4oをバックエンドとして、AutoKaggleやDataInterpreterといった最先端のエンドツーエンドデータサイエンスシステムと比較し、異なる特徴を持つ9つのデータセット上のVDSAgentを評価した。
VDSAgentsはAutoKaggleとDataInterpreterの結果を一貫して上回り、PCS原則をLCM駆動のデータサイエンス自動化に組み込む可能性を検証する。
関連論文リスト
- A Survey of Data Agents: Emerging Paradigm or Overstated Hype? [66.1526688475023]
現在「データエージェント」は用語的曖昧さと不整合性に悩まされている。
この調査では、データエージェントのための最初の体系的な階層型分類を紹介した。
プロアクティブな生成データエージェントの出現を想定する、先見的なロードマップで締めくくります。
論文 参考訳(メタデータ) (2025-10-27T17:54:07Z) - Data Shift of Object Detection in Autonomous Driving [0.40792653193642503]
自律走行物体検出タスクにおけるデータシフト問題について検討する。
我々は、データセットの分類とバランスをとるためにシフト検出分析技術を採用している。
このアプローチを検証するために,CycleGANベースのデータ拡張技術とYOLOv5フレームワークを統合することにより,モデルを最適化する。
論文 参考訳(メタデータ) (2025-08-16T01:52:31Z) - GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics [9.549568621873386]
GateLensは、自動車分野のデータ分析のためのLLMベースのシステムである。
遅くて不透明でメンテナンスにコストがかかる従来のマルチエージェントや計画ベースのシステムとは異なり、GateLensはスピード、透明性、信頼性を強調している。
論文 参考訳(メタデータ) (2025-03-27T17:48:32Z) - DatawiseAgent: A Notebook-Centric LLM Agent Framework for Adaptive and Robust Data Science Automation [10.390461679868197]
我々は、適応的で堅牢なデータサイエンス自動化のためのノートブック中心の大規模言語モデル(LLM)エージェントフレームワークであるDatawiseAgentを紹介する。
人間のデータサイエンティストが計算ノートブックでどのように機能するかに触発されたDatawiseAgentは、統一された相互作用表現とマルチステージアーキテクチャを導入した。
論文 参考訳(メタデータ) (2025-03-10T08:32:33Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - DSBench: How Far Are Data Science Agents from Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization [86.61052121715689]
MatPlotAgentは、科学的データ可視化タスクを自動化するために設計された、モデルに依存しないフレームワークである。
MatPlotBenchは、100人の検証されたテストケースからなる高品質なベンチマークである。
論文 参考訳(メタデータ) (2024-02-18T04:28:28Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。