論文の概要: EvoDS: Self-Evolving Autonomous Data Science Agent with Skill Learning and Context Management
- arxiv url: http://arxiv.org/abs/2606.03841v1
- Date: Tue, 02 Jun 2026 16:20:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:05.153117
- Title: EvoDS: Self-Evolving Autonomous Data Science Agent with Skill Learning and Context Management
- Title(参考訳): EvoDS: スキル学習とコンテキスト管理を備えた自己進化型自律データサイエンスエージェント
- Authors: Zherui Yang, Fan Liu, Yansong Ning, Hao Liu,
- Abstract要約: EvoDSは自己進化型の自律データサイエンスエージェントで、そのスキルを拡張し、長期的なコンテキストを適応的に管理することを学ぶ。
EvoDSは4つの異なるベンチマークで、最先端のオープンソースデータサイエンスエージェントを平均28.9%上回っている。
- 参考スコア(独自算出の注目度): 16.997238524083365
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent progress in Large Language Model (LLM) agents has enabled promising advances in automated data science. However, existing approaches remain fundamentally limited by their static action sets and lack of principled long-horizon context management, hindering their ability to accumulate reusable experience across tasks and operate reliably in multi-stage, iterative data science pipelines. To address these challenges, we introduce EvoDS, a self-evolving autonomous data science agent that learns to expand its skills and adaptively managing long-term context through agentic reinforcement learning. Specifically, EvoDS introduces two key strategies: (1) Autonomous Skill Acquisition (ASA) mechanism, which enables agents to synthesize, validate, and reuse executable skills; and (2) Adaptive Context Compression (ACC) strategy, which treats context management as a learned control problem rather than passive truncation. These strategies are orchestrated within a two-stage multi-agent training scheme, enabling EvoDS to autonomously improve over time. Theoretically, we prove that EvoDS's hierarchical design reduces tool-selection error, and its optimization objective aligns with an information bottleneck principle, ensuring efficient context use. Empirically, EvoDS outperforms state-of-the-art open-source data science agents by an average of 28.9% across four diverse benchmarks while eliminating out-of-token failures. Our code and data are available at https://github.com/usail-hkust/EvoDS.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントの最近の進歩は、自動データサイエンスの有望な進歩を可能にしている。
しかし、既存のアプローチは、静的なアクションセットと原則化された長期のコンテキスト管理の欠如により、タスク間で再利用可能なエクスペリエンスを蓄積し、マルチステージで反復的なデータサイエンスパイプラインで確実に運用する能力を妨げている。
これらの課題に対処するため、エージェント強化学習を通じて、そのスキルを拡張し、長期的なコンテキストを適応的に管理する自己進化型自律データサイエンスエージェントであるEvoDSを紹介した。
具体的には、(1)エージェントが実行可能なスキルを合成、検証、再利用できる自律スキル獲得(ASA)機構、(2)適応コンテキスト圧縮(ACC)戦略、(2)受動トランケーションよりも文脈管理を学習制御問題として扱う。
これらの戦略は2段階のマルチエージェントトレーニングスキームで編成され、EvoDSは時間とともに自律的に改善できる。
理論的には、EvoDSの階層設計はツール選択の誤差を低減し、その最適化目標は情報ボトルネックの原則と整合し、効率的なコンテキスト利用を保証する。
実証的には、EvoDSは4つのベンチマークで、最先端のオープンソースデータサイエンスエージェントを平均28.9%上回り、異常を排除している。
私たちのコードとデータはhttps://github.com/usail-hkust/EvoDS.comで公開されています。
関連論文リスト
- ANDES: Agent Native Data Evolving Synthesis Tool for Autonomous Instruction Alignment [9.28566352356072]
Andesは、データ生成をプラグアンドプレイのEmphエージェントスキルとして再定義するフレームワークである。
We demonstrate that Andes improves automated alignment, secure-of-the-art performance on PostTrainBench。
論文 参考訳(メタデータ) (2026-05-31T15:03:50Z) - Ace-Skill: Bootstrapping Multimodal Agents with Prioritized and Clustered Evolution [57.04954428528267]
我々は,自己進化型マルチモーダルエージェントのためのロールアウトアロケーションと知識組織を共同で最適化する,共同進化型フレームワークであるAce-Skillを紹介する。
Ace-Skillは、プライオリティ化されたサンプルと遅延分解能のトラッキングを組み合わせることで、情報的かつ十分にマスターされたサンプルにロールアウトを集中させる。
サンプリングと組織化を改善することで、Ace-Skillは自己進化を、より情報に富んだロールアウトが高品質な知識を生み出す、活発なサイクルに変えます。
論文 参考訳(メタデータ) (2026-05-09T11:12:54Z) - RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback [54.39884046754265]
RetroAgentは、エージェントが複雑なインタラクティブ環境をマスターできるオンラインRLフレームワークである。
実験の結果,RetroAgentはSOTA(State-of-the-art)の性能を達成できた。
論文 参考訳(メタデータ) (2026-03-09T16:23:33Z) - Data Science and Technology Towards AGI Part I: Tiered Data Management [53.64581824953229]
我々は、人工知能の開発がデータモデル共進化の新しい段階に入ったと論じる。
我々は、未処理のリソースから組織的で検証可能な知識まで、L0-L4階層のデータ管理フレームワークを紹介します。
提案手法の有効性を実証研究により検証する。
論文 参考訳(メタデータ) (2026-02-09T18:47:51Z) - EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience [44.734653745434834]
本稿では,ネイティブコンピュータ利用エージェントモデルであるEvoCUAを紹介する。
静的な模倣とは異なり、EvoCUAはデータ生成とポリシー最適化を自己持続的な進化サイクルに統合する。
EvoCUAは以前の最高のオープンソースモデルであるOpenCUA-72Bを大きく上回っている。
論文 参考訳(メタデータ) (2026-01-22T11:36:43Z) - Decouple to Generalize: Context-First Self-Evolving Learning for Data-Scarce Vision-Language Reasoning [41.523848964102]
最近の視覚言語モデル(VLM)は強化学習(RL)を通して顕著な推論を実現する
RLは、経験の時代に連続的に進化する大規模視覚言語モデル(LVLM)を実現するための実現可能なソリューションを提供する。
合成データや自己回帰機構といった既存の戦略は、限られた分布とアライメントの困難に悩まされている。
問題解決ではなく,まず文脈から学習するようにモデルに誘導する,二重分離フレームワークDoGeを提案する。
論文 参考訳(メタデータ) (2025-12-07T13:17:31Z) - A Survey of Data Agents: Emerging Paradigm or Overstated Hype? [66.1526688475023]
現在「データエージェント」は用語的曖昧さと不整合性に悩まされている。
この調査では、データエージェントのための最初の体系的な階層型分類を紹介した。
プロアクティブな生成データエージェントの出現を想定する、先見的なロードマップで締めくくります。
論文 参考訳(メタデータ) (2025-10-27T17:54:07Z) - The Path of Self-Evolving Large Language Models: Achieving Data-Efficient Learning via Intrinsic Feedback [51.144727949988436]
強化学習(RL)は、大規模言語モデル(LLM)の推論能力を高める可能性を実証した。
本研究では,最小限のデータを用いたLLによるLLMの改善について検討する。
データ依存を最小限に抑えるため、自己認識に基礎を置いた2つの新しいメカニズムを導入する。
論文 参考訳(メタデータ) (2025-10-03T06:32:10Z) - DACL-RAG: Data Augmentation Strategy with Curriculum Learning for Retrieval-Augmented Generation [54.26665681604041]
DACL-RAGは多段階データ拡張戦略と多段階学習パラダイムを組み合わせた多段階RAGトレーニングフレームワークである。
我々のフレームワークは、4つのオープンドメインQAデータセットで一貫した有効性を示し、複数の高度なメソッドに対して2%から4%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-05-15T16:53:04Z) - Collaborative Evolving Strategy for Automatic Data-Centric Development [17.962373755266068]
本稿では,自動データ中心開発(AD2)タスクを紹介する。
ドメインエキスパートのようなタスクスケジューリングと実装能力を必要とする、その中核的な課題を概説している。
本稿では,Retrieval による協調的知恵強化進化という戦略を取り入れた自律エージェントを提案する。
論文 参考訳(メタデータ) (2024-07-26T12:16:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。