論文の概要: Exploring Autonomous Agentic Data Engineering for Model Specialization
- arxiv url: http://arxiv.org/abs/2605.30407v1
- Date: Thu, 28 May 2026 17:50:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.149753
- Title: Exploring Autonomous Agentic Data Engineering for Model Specialization
- Title(参考訳): モデルスペシャライゼーションのための自律エージェントデータエンジニアリングの探索
- Authors: Yujie Luo, Xiangyuan Ru, Jingsheng Zheng, Jingjing Wang, Yuqi Zhu, Jintian Zhang, Runnan Fang, Kewei Xu, Ye Liu, Zheng Wei, Jiang Bian, Zang Li, Shumin Deng,
- Abstract要約: 大規模言語モデル (LLM) は一般的なタスクにおいて高いパフォーマンスを示し、特殊なドメインへの適応に苦慮することが多い。
我々は、LSMを自律データエンジニアとして評価するための新しいタスクである textbf Autonomous Agentic Data Engineering を定式化した。
GPT-5.2 は textbf57.29% で学生モデルを改善する訓練カリキュラムを構築している。
- 参考スコア(独自算出の注目度): 37.35310287793494
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Models (LLMs) have demonstrated strong performance on general tasks, while often struggling to adapt to specialized domains without high-quality domain-specific data. Existing LLM-based data curation methods primarily rely on human-designed workflows, leaving it unexamined whether LLMs can autonomously execute an end-to-end data engineering pipeline for model specialization. We formalize \textbf{Autonomous Agentic Data Engineering}, a novel task designed to evaluate LLMs as autonomous data engineers that drive model specialization through end-to-end data curation. We frame data as an optimizable component and study agents that plan, generate, and iteratively optimize training data across multiple domains, guided by post-training performance improvement. Experiments show that autonomous LLM data engineers yield substantial gains, as GPT-5.2 constructs a training curriculum that improves a student model by \textbf{57.29\%}, entirely through iterative, agent-driven data adaptation. By illuminating both potential and bottlenecks, our study establishes autonomous data engineering as a measurable capability and charts a path toward agent-driven model specialization\footnote{Code will be released at https://github.com/zjunlp/DataAgent.}.
- Abstract(参考訳): 大規模言語モデル(LLM)は一般的なタスクにおいて高いパフォーマンスを示し、高品質なドメイン固有データを持たない特殊なドメインへの適応に苦慮することが多い。
既存のLLMベースのデータキュレーション手法は、主に人間設計のワークフローに依存しており、LLMがモデル特殊化のためにエンドツーエンドのデータエンジニアリングパイプラインを自律的に実行できるかどうかを考慮していない。
我々は、エンド・ツー・エンドのデータキュレーションによるモデル特殊化を推進する自律データエンジニアとしてLLMを評価するために設計された新しいタスクである、‘textbf{Autonomous Agentic Data Engineering} を定式化した。
データを最適化可能なコンポーネントとして、複数のドメインにわたるトレーニングデータを計画し、生成し、反復的に最適化するエージェントとして、トレーニング後のパフォーマンス改善によって導かれる。
GPT-5.2は、反復的、エージェント駆動のデータ適応によって学生モデルを改善する訓練カリキュラムを構築している。
可能性とボトルネックの両方を照らすことによって、自動データエンジニアリングを測定可能な能力として確立し、エージェント駆動モデル特殊化への道筋をグラフ化します。
と。
関連論文リスト
- Guiding LLM Post-training Data Engineering with Model Internals from Sparse Autoencoders [49.87696007629591]
トレーニング後のデータエンジニアリングは外部信号に大きく依存しており、モデル内部にある豊富な固有信号を無視している。
強化学習のためのデータエンジニアリングフレームワークSAERLを提案する。
Sparse Autoencoder(SAE)によって抽出されたモデル内部を使用して、多様性、難易度、品質の3つの固有のデータ特性をモデル化する。
論文 参考訳(メタデータ) (2026-05-26T17:55:59Z) - Learn More, Forget Less: A Gradient-Aware Data Selection Approach for LLM [51.21051698747157]
大規模言語モデル(LLM)の教師付き微調整のための自己適応型勾配対応データ選択手法(GrADS)を提案する。
具体的には、勾配の大きさと統計的分布を利用した自己指導型基準を設計し、モデルの学習プロセスに最も寄与する例を優先する。
GrADSは、医学、法学、金融など様々な分野にまたがる様々なLLMの広範な実験を通じて、大幅な効率性と費用対効果を示してきた。
論文 参考訳(メタデータ) (2025-11-07T08:34:50Z) - DeepAnalyze: Agentic Large Language Models for Autonomous Data Science [35.69385623867138]
我々は、自律データサイエンス用に設計された最初のエージェントであるDeepAnalyze-8Bを紹介する。
本稿では,人間のデータ科学者の学習軌道をエミュレートするカリキュラムに基づくエージェント・トレーニング・パラダイムを提案する。
また、高品質なトレーニングデータを構成するデータ基底軌道合成フレームワークについても紹介する。
論文 参考訳(メタデータ) (2025-10-19T15:13:42Z) - LLM/Agent-as-Data-Analyst: A Survey [54.08761322298559]
大規模言語モデル(LLM)とエージェント技術は、データ分析タスクの機能と開発パラダイムに根本的な変化をもたらした。
LLMは複雑なデータ理解、自然言語、意味分析機能、自律パイプラインオーケストレーションを可能にする。
論文 参考訳(メタデータ) (2025-09-28T17:31:38Z) - LaMDAgent: An Autonomous Framework for Post-Training Pipeline Optimization via LLM Agents [3.6117068575553595]
トレーニング後の完全なパイプラインを自律的に構築し、最適化するフレームワークであるLaMDAgentを紹介します。
LaMDAgentは、ツールの使用精度を9.0ポイント向上し、命令追従機能を保持する。
従来の人間主導の探査で見落とされがちな効果的なポストトレーニング戦略を明らかにする。
論文 参考訳(メタデータ) (2025-05-28T04:30:51Z) - Language Models as Continuous Self-Evolving Data Engineers [32.67875951851165]
大規模言語モデル(LLM)は、様々なタスクにおいて顕著な能力を示している。
従来のトレーニングアプローチは、専門家ラベル付きデータに大きく依存しています。
我々はLANCEという新しいパラダイムを提案し、LLMはデータの自動生成、クリーニング、レビュー、注釈付けによって自らを訓練することができる。
論文 参考訳(メタデータ) (2024-12-19T18:28:41Z) - Building a Family of Data Augmentation Models for Low-cost LLM Fine-tuning on the Cloud [12.651588927599441]
モデル微調整の効率を大幅に向上するために,データ拡張モデル群を提案する。
これらのモデルは十分に小さなLLMに基づいて訓練され、推論コストの低い重要な機能をサポートする。
実験と応用研究は、我々のアプローチの有効性を証明した。
論文 参考訳(メタデータ) (2024-12-06T09:04:12Z) - Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文 参考訳(メタデータ) (2024-10-22T06:43:28Z) - SELF-GUIDE: Better Task-Specific Instruction Following via Self-Synthetic Finetuning [70.21358720599821]
大規模言語モデル(LLM)は、適切な自然言語プロンプトを提供する際に、多様なタスクを解決するという約束を持っている。
学生LLMからタスク固有の入出力ペアを合成する多段階メカニズムであるSELF-GUIDEを提案する。
ベンチマークの指標から,分類タスクに約15%,生成タスクに18%の絶対的な改善を報告した。
論文 参考訳(メタデータ) (2024-07-16T04:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。