論文の概要: Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction
- arxiv url: http://arxiv.org/abs/2603.11808v1
- Date: Thu, 12 Mar 2026 11:10:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.040622
- Title: Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction
- Title(参考訳): オープンソースエージェントリポジトリの大規模マイニングによるスキル獲得の自動化:マルチエージェントな手続き的知識抽出のためのフレームワーク
- Authors: Shuzhen Bi, Mengsong Wu, Hao Hao, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou,
- Abstract要約: 本報告では,オープンソースリポジトリのマイニングによる高品質エージェントスキルの自動獲得の枠組みについて検討する。
我々は,TheoremExplainAgentやCode2Videoなどの最先端システムから,可視化と教育能力の抽出に重点を置いている。
エージェントリポジトリからの体系的抽出と厳密なセキュリティガバナンスと多次元評価指標を組み合わせることで、手続き的知識のスケーラブルな獲得が可能になることを実証する。
- 参考スコア(独自算出の注目度): 20.467661664708086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The transition from monolithic large language models (LLMs) to modular, skill-equipped agents represents a fundamental architectural shift in artificial intelligence deployment. While general-purpose models demonstrate remarkable breadth in declarative knowledge, their utility in autonomous workflows is frequently constrained by insufficient specialized procedural expertise. This report investigates a systematic framework for automated acquisition of high-quality agent skills through mining of open-source repositories on platforms such as GitHub. We focus on the extraction of visualization and educational capabilities from state-of-the-art systems including TheoremExplainAgent and Code2Video, both utilizing the Manim mathematical animation engine. The framework encompasses repository structural analysis, semantic skill identification through dense retrieval, and translation to the standardized SKILL.md format. We demonstrate that systematic extraction from agentic repositories, combined with rigorous security governance and multi-dimensional evaluation metrics, enables scalable acquisition of procedural knowledge that augments LLM capabilities without requiring model retraining. Our analysis reveals that agent-generated educational content can achieve 40\% gains in knowledge transfer efficiency while maintaining pedagogical quality comparable to human-crafted tutorials.
- Abstract(参考訳): モノリシックな大規模言語モデル(LLM)からモジュラーなスキルを持ったエージェントへの移行は、人工知能のデプロイメントにおける基本的なアーキテクチャ上のシフトを表している。
汎用モデルは宣言的知識において顕著な広さを示すが、自律的ワークフローにおけるそれらの実用性は、専門的な手続き的専門知識の不足によってしばしば制約される。
本稿では、GitHubなどのプラットフォーム上でオープンソースリポジトリをマイニングすることで、高品質なエージェントスキルの自動獲得のための体系的なフレームワークについて検討する。
我々は,TheoremExplainAgent や Code2Video などの最先端システムからの可視化と教育能力の抽出に重点を置いており,どちらも Manim の数学的アニメーションエンジンを利用している。
このフレームワークは、リポジトリの構造解析、密集検索によるセマンティックスキルの識別、標準化されたSKILL.mdフォーマットへの変換を含む。
エージェントリポジトリからの体系的抽出と厳密なセキュリティガバナンスと多次元評価指標を組み合わせることで、モデル再トレーニングを必要とせずにLLM能力を増強する手続き的知識のスケーラブルな獲得が可能になることを実証する。
本分析により,人為的なチュートリアルに匹敵する教育的品質を維持しつつ,エージェント生成による学習内容が知識伝達効率の40%向上を達成できることが明らかになった。
関連論文リスト
- El Agente Gráfico: Structured Execution Graphs for Scientific Agents [7.47895130442454]
タイプセーフな実行環境内に,大規模言語モデル(LLM)による意思決定を組み込んだ単一エージェントフレームワークであるEl Agente Grficoを紹介する。
我々のアプローチの中心は、科学概念の構造化された抽象化と、型付きPythonオブジェクトとして計算状態を表すオブジェクトグラフマッパーである。
大学レベルの量子化学タスクのスイートにまたがって,自動ベンチマークフレームワークを開発することにより,システムの評価を行う。
論文 参考訳(メタデータ) (2026-02-19T23:47:05Z) - Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward [5.124116559484265]
モノリシックな言語モデルからモジュール化された、スキルを持ったエージェントへの移行は、大規模言語モデル(LLM)の実際のデプロイ方法に決定的な変化をもたらす。
すべての手続き的知識をモデルウェイト内にエンコードするのではなく、エージェントスキルは、再トレーニングせずに動的機能拡張を可能にする。
この調査は、エージェントスキルのランドスケープを包括的に扱うもので、ここ数ヶ月で急速に進化してきた。
論文 参考訳(メタデータ) (2026-02-12T21:33:25Z) - Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.73992315826035]
ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文 参考訳(メタデータ) (2025-12-31T04:25:11Z) - An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - Integrating Machine Learning into Belief-Desire-Intention Agents: Current Advances and Open Challenges [1.4323566945483497]
本稿では,BDI(Belief-Desire-Intention)パラダイムを参考に,既存のアプローチの詳細な体系化を提案する。
本分析は,MLにより強化された有理的エージェントに関する急速な発展傾向を示すとともに,効果的な有理的MLエージェントを設計するための重要な研究の機会とオープンな課題を明らかにする。
論文 参考訳(メタデータ) (2025-10-23T15:15:45Z) - WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning [73.91893534088798]
WebSailorは、この重要な機能を組み込むように設計された、完全なポストトレーニング方法論である。
我々のアプローチは、構造化サンプリングと情報難読化によって、新しい、不確実なタスクを生成することである。
WebSailorは複雑な情報検索タスクにおいて、すべてのオープンソースエージェントを著しく上回る。
論文 参考訳(メタデータ) (2025-09-16T17:57:03Z) - MaskSearch: A Universal Pre-Training Framework to Enhance Agentic Search Capability [106.35604230971396]
最近のエージェント技術の進歩により、大規模言語モデル(LLM)は、検索、計画、推論のためのツールを自律的に活用することができる。
エージェントの普遍的な検索能力を高めるために,新しい事前学習フレームワークMaskSearchを提案する。
事前学習の段階では、検索ツールを用いてマスク付きスパンを埋めるRetrieval Augmented Mask Prediction (RAMP)タスクを導入する。
その後、モデルは下流のタスクでトレーニングされ、さらなる改善が達成されます。
論文 参考訳(メタデータ) (2025-05-26T17:58:50Z) - Symbolic Learning Enables Self-Evolving Agents [55.625275970720374]
エージェントシンボリックラーニング(エージェントシンボリックラーニング)(エージェントシンボリックラーニング)は、言語エージェントが自分自身で最適化できるための体系的なフレームワークである。
エージェント記号学習は、コネクショナリズム学習における2つの基本的なアルゴリズムを模倣することにより、言語エージェント内のシンボルネットワークを最適化するように設計されている。
我々は、標準ベンチマークと複雑な実世界のタスクの両方で概念実証実験を行う。
論文 参考訳(メタデータ) (2024-06-26T17:59:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。