論文の概要: VDSAgents: A PCS-Guided Multi-Agent System for Veridical Data Science Automation
- arxiv url: http://arxiv.org/abs/2510.24339v2
- Date: Wed, 29 Oct 2025 04:05:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 13:34:45.463859
- Title: VDSAgents: A PCS-Guided Multi-Agent System for Veridical Data Science Automation
- Title(参考訳): VDSAgents: 検証データサイエンス自動化のためのPCS-Guided Multi-Agent System
- Authors: Yunxuan Jiang, Silan Hu, Xiaoning Wang, Yuanyuan Zhang, Xiangyu Chang,
- Abstract要約: 大規模言語モデル(LLM)は、自動システム設計のためのデータサイエンスにますます統合される。
本稿では,PCS(Predictability-Computability-Stability)の原則に基づくマルチエージェントシステムであるVDSAgentsを提案する。
VDSAgentsを、最先端のエンドツーエンドデータサイエンスシステムと比較し、様々な特徴を持つ9つのデータセット上で評価する。
- 参考スコア(独自算出の注目度): 11.521235834823301
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) become increasingly integrated into data science workflows for automated system design. However, these LLM-driven data science systems rely solely on the internal reasoning of LLMs, lacking guidance from scientific and theoretical principles. This limits their trustworthiness and robustness, especially when dealing with noisy and complex real-world datasets. This paper provides VDSAgents, a multi-agent system grounded in the Predictability-Computability-Stability (PCS) principles proposed in the Veridical Data Science (VDS) framework. Guided by PCS principles, the system implements a modular workflow for data cleaning, feature engineering, modeling, and evaluation. Each phase is handled by an elegant agent, incorporating perturbation analysis, unit testing, and model validation to ensure both functionality and scientific auditability. We evaluate VDSAgents on nine datasets with diverse characteristics, comparing it with state-of-the-art end-to-end data science systems, such as AutoKaggle and DataInterpreter, using DeepSeek-V3 and GPT-4o as backends. VDSAgents consistently outperforms the results of AutoKaggle and DataInterpreter, which validates the feasibility of embedding PCS principles into LLM-driven data science automation.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自動システム設計のためのデータサイエンスワークフローにますます統合される。
しかし、これらのLLM駆動型データサイエンスシステムは、科学と理論の原理からのガイダンスが欠如しているため、LSMの内部的推論にのみ依存している。
これにより、特にノイズの多い複雑な実世界のデータセットを扱う場合、信頼性と堅牢性が制限される。
本稿では,PCS(Predictability-Computability-Stability)の原則に基づくマルチエージェントシステムであるVDSAgentsを,VDS(Veridical Data Science)フレームワークで提案する。
PCSの原則によってガイドされたこのシステムは、データクリーニング、機能エンジニアリング、モデリング、評価のためのモジュラーワークフローを実装している。
各フェーズはエレガントなエージェントによって処理され、機能と科学的監査性の両方を保証するために摂動解析、単体テスト、モデル検証が組み込まれている。
我々は、DeepSeek-V3とGPT-4oをバックエンドとして、AutoKaggleやDataInterpreterといった最先端のエンドツーエンドデータサイエンスシステムと比較し、異なる特徴を持つ9つのデータセット上のVDSAgentを評価した。
VDSAgentsはAutoKaggleとDataInterpreterの結果を一貫して上回り、PCS原則をLCM駆動のデータサイエンス自動化に組み込む可能性を検証する。
関連論文リスト
- An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - Multi-Agent Systems for Dataset Adaptation in Software Engineering: Capabilities, Limitations, and Future Directions [8.97512410819274]
本稿では,データセット適応タスクにおいて,最先端のマルチエージェントシステムがどのように機能するかについて,最初の実証的研究を行う。
我々は、GitHub Copilotを評価し、ROCODEやLogHub2.0といったベンチマークリポジトリからSE研究成果物を適用する。
その結果、現在のシステムはキーファイルを識別し、部分的な適応を生成することができるが、正しい実装を生成することは滅多にない。
論文 参考訳(メタデータ) (2025-11-26T13:26:11Z) - Dataforge: A Data Agent Platform for Autonomous Data Engineering [22.691284342164334]
Data Agentは、表データに特化した完全に自律的なシステムである。
データクリーニング、階層的ルーティング、デュアルフィードバックループによる機能レベルの最適化を自動的に実行する。
自動、安全、非専門家フレンドリーという3つの基本原則を具現化し、人間の監督なしにエンドツーエンドの信頼性を保証する。
論文 参考訳(メタデータ) (2025-11-09T01:58:13Z) - A Survey of Data Agents: Emerging Paradigm or Overstated Hype? [66.1526688475023]
現在「データエージェント」は用語的曖昧さと不整合性に悩まされている。
この調査では、データエージェントのための最初の体系的な階層型分類を紹介した。
プロアクティブな生成データエージェントの出現を想定する、先見的なロードマップで締めくくります。
論文 参考訳(メタデータ) (2025-10-27T17:54:07Z) - Autonomous Data Agents: A New Opportunity for Smart Data [50.02229219403014]
DataAgentsは、自律的なデータから知識システムへのパラダイムシフトを表している、とReportは主張する。
DataAgentsは、複雑で非構造化されたデータをコヒーレントで行動可能な知識に変換する。
エージェントAIとデータ・トゥ・ナレッジシステムの収束が重要なトレンドとなっている理由を最初に検討する。
論文 参考訳(メタデータ) (2025-09-23T06:46:41Z) - Data Shift of Object Detection in Autonomous Driving [0.40792653193642503]
自律走行物体検出タスクにおけるデータシフト問題について検討する。
我々は、データセットの分類とバランスをとるためにシフト検出分析技術を採用している。
このアプローチを検証するために,CycleGANベースのデータ拡張技術とYOLOv5フレームワークを統合することにより,モデルを最適化する。
論文 参考訳(メタデータ) (2025-08-16T01:52:31Z) - GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics [9.549568621873386]
GateLensは、自動車分野のデータ分析のためのLLMベースのシステムである。
遅くて不透明でメンテナンスにコストがかかる従来のマルチエージェントや計画ベースのシステムとは異なり、GateLensはスピード、透明性、信頼性を強調している。
論文 参考訳(メタデータ) (2025-03-27T17:48:32Z) - DatawiseAgent: A Notebook-Centric LLM Agent Framework for Adaptive and Robust Data Science Automation [10.390461679868197]
我々は、適応的で堅牢なデータサイエンス自動化のためのノートブック中心の大規模言語モデル(LLM)エージェントフレームワークであるDatawiseAgentを紹介する。
人間のデータサイエンティストが計算ノートブックでどのように機能するかに触発されたDatawiseAgentは、統一された相互作用表現とマルチステージアーキテクチャを導入した。
論文 参考訳(メタデータ) (2025-03-10T08:32:33Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - DSBench: How Far Are Data Science Agents from Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization [86.61052121715689]
MatPlotAgentは、科学的データ可視化タスクを自動化するために設計された、モデルに依存しないフレームワークである。
MatPlotBenchは、100人の検証されたテストケースからなる高品質なベンチマークである。
論文 参考訳(メタデータ) (2024-02-18T04:28:28Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。