論文の概要: ANDES: Agent Native Data Evolving Synthesis Tool for Autonomous Instruction Alignment
- arxiv url: http://arxiv.org/abs/2606.01279v1
- Date: Sun, 31 May 2026 15:03:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.492676
- Title: ANDES: Agent Native Data Evolving Synthesis Tool for Autonomous Instruction Alignment
- Title(参考訳): ANDES: 自律的指導アライメントのためのエージェントネイティブデータ進化型合成ツール
- Authors: Zhengyang Zhao, Shengjie Ye, Lu Ma, Hao Liang, Hengyi Feng, Wentao Zhang,
- Abstract要約: Andesは、データ生成をプラグアンドプレイのEmphエージェントスキルとして再定義するフレームワークである。
We demonstrate that Andes improves automated alignment, secure-of-the-art performance on PostTrainBench。
- 参考スコア(独自算出の注目度): 9.28566352356072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI agents are increasingly being tasked with automating AI research itself, particularly the critical post-training phase that transforms base LLMs into aligned assistants. However, recent evaluations reveal that even frontier agents struggle to perform this task. While the success of post-training fundamentally relies on acquiring high-quality data, relying on agents to autonomously curate targeted training datasets from the open web introduces severe challenges. Executing the long-horizon tasks of searching, filtering, and balancing data within noisy web environments frequently overwhelms an agent's limited context, ultimately leading to degraded dataset quality and suboptimal downstream training performance. To bridge this gap, we introduce Andes (Agent Native Data Evolving Synthesis), a framework that reimagines data generation as a plug-and-play \emph{agent skill}. Rather than forcing agents to devise complex data-gathering strategies from scratch, \textsc{Andes} provides an intelligent abstraction layer. By leveraging a self-evolving World Tree routing mechanism and actionable diagnostic reports, it allows trainer agents to dynamically steer data synthesis through an interactive, closed-loop interface. We demonstrate that under strict compute constraints, equipping foundationally weaker agents with Andes improves automated alignment, securing state-of-the-art performance on PostTrainBench and robust cross-task generalization. Our project is available at https://github.com/zzy1127/ANDES.
- Abstract(参考訳): AIエージェントは、AI研究自体の自動化、特にベースLLMを整列したアシスタントに変換するトレーニング後の重要なフェーズに、ますます取り組まれている。
しかし、最近の評価では、フロンティアエージェントでさえこのタスクを実行するのに苦労している。
ポストトレーニングの成功は基本的に高品質なデータを取得することに依存しているが、オープンWebからターゲットとするトレーニングデータセットを自律的にキュレートするエージェントに依存しているため、深刻な問題が発生する。
ノイズの多いWeb環境におけるデータの検索、フィルタリング、バランスの長いタスクの実行は、エージェントの限られたコンテキストを圧倒し、最終的にデータセットの品質が低下し、下流でのトレーニングパフォーマンスが低下する。
このギャップを埋めるために、私たちはAndes(Agent Native Data Evolving Synthesis)を紹介します。
エージェントに複雑なデータ収集戦略をゼロから考案させるのではなく、‘textsc{Andes}’はインテリジェントな抽象化層を提供する。
自己進化するWorld Treeルーティング機構と実行可能な診断レポートを活用することで、トレーナーエージェントがインタラクティブでクローズドループインターフェースを通じてデータ合成を動的に行うことができる。
厳密な計算制約の下では、アンデスと基礎的に弱いエージェントを装備することで、自動アライメントが改善され、PostTrainBenchの最先端性能と堅牢なクロスタスク一般化が保証される。
私たちのプロジェクトは、https://github.com/zzy1127/ANDES.comで利用可能です。
関連論文リスト
- AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.512393568258105]
大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。
本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:21:42Z) - From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents [23.583947864141162]
EigenDataは階層的なマルチエージェントエンジンで、ツール基底の対話と実行可能なインスタンスごとのチェッカーを合成する。
合成データに基づいて、まずユーザモデルを微調整し、GRPOスタイルのトレーニングを適用するRLレシピを開発する。
以上の結果から,高価なアノテーションを使わずに,複雑なツールの動作をブートストラップするためのスケーラブルな経路が示唆された。
論文 参考訳(メタデータ) (2026-01-30T06:01:23Z) - Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文 参考訳(メタデータ) (2025-11-20T05:01:57Z) - A Survey of Data Agents: Emerging Paradigm or Overstated Hype? [66.1526688475023]
現在「データエージェント」は用語的曖昧さと不整合性に悩まされている。
この調査では、データエージェントのための最初の体系的な階層型分類を紹介した。
プロアクティブな生成データエージェントの出現を想定する、先見的なロードマップで締めくくります。
論文 参考訳(メタデータ) (2025-10-27T17:54:07Z) - Synthesizing Agentic Data for Web Agents with Progressive Difficulty Enhancement Mechanisms [81.90219895125178]
Webベースの「ディープリサーチ」エージェントは、オンラインツールとの長時間のインタラクションを通じてタスクに答える、複雑な問題の解決を目指している。
基礎となる言語モデルは、長い水平推論に最適化されないことが多いため、これらのタスクは依然として困難なままである。
複雑化を徐々に進めることで、疑問-答えのペアを生成する2段階のデータ合成パイプラインを導入する。
論文 参考訳(メタデータ) (2025-10-15T06:34:46Z) - Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.49715661395294]
データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文 参考訳(メタデータ) (2025-06-22T12:59:12Z) - DatawiseAgent: A Notebook-Centric LLM Agent Framework for Adaptive and Robust Data Science Automation [10.390461679868197]
我々は、適応的で堅牢なデータサイエンス自動化のためのノートブック中心の大規模言語モデル(LLM)エージェントフレームワークであるDatawiseAgentを紹介する。
人間のデータサイエンティストが計算ノートブックでどのように機能するかに触発されたDatawiseAgentは、統一された相互作用表現とマルチステージアーキテクチャを導入した。
論文 参考訳(メタデータ) (2025-03-10T08:32:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。