論文の概要: Agents-K1: Towards Agent-native Knowledge Orchestration
- arxiv url: http://arxiv.org/abs/2606.13669v1
- Date: Thu, 11 Jun 2026 17:58:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.978607
- Title: Agents-K1: Towards Agent-native Knowledge Orchestration
- Title(参考訳): Agents-K1: エージェントネイティブな知識オーケストレーションを目指す
- Authors: Zongsheng Cao, Bihao Zhan, Jinxin Shi, Jiong Wang, Fangchen Yu, Zhijie Zhong, Zijie Guo, Tianshuo Peng, Zhuo Liu, Yi Xie, Xiang Zhuang, Yue Fan, Runmin Ma, Shiyang Feng, Xiangchao Yan, Anran Liu, Peng Ye, Wenlong Zhang, Shufei Zhang, Chunfeng Song, Fenghua Ling, Jie Zhou, Liang He, Bo Zhang, Lei Bai,
- Abstract要約: textbfAgents-K1はエンドツーエンドの知識オーケストレーションパイプラインである。
生文書をエージェントネイティブな科学知識グラフに変換する。
我々は6つの被験者にわたる246万件の科学論文を処理し、TextbfScholar-KGを作成し、そのうち100万件の論文のサブセットを公開します。
- 参考スコア(独自算出の注目度): 59.22667222947257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current LLM-based research agents have advanced through agent orchestration, yet largely overlook scientific knowledge orchestration. Existing works often reduce papers to abstracts, surface mentions, and flat \texttt{cites} edges, omitting key entities, claims, evidence, mechanisms, and method lineages essential for scientific reasoning. To this end, we introduce \textbf{Agents-K1}, an end-to-end knowledge orchestration pipeline that converts raw documents into agent-native scientific knowledge graphs. Agents-K1 integrates three components under a unifying theoretical foundation: a multimodal parser whose five-module schema captures entities, multimodal evidence, citations, and typed inter-entity relations across the full paper rather than abstracts alone; a 4B information-extraction backbone trained with GRPO under a rule-based reward; and a graphanything CLI, a tri-source agent interface that unifies web search, multimodal graph retrieval, and cross-document traversal. On top of this, we process 2.46 million scientific papers across six subjects to produce \textbf{Scholar-KG}, of which we release a one-million-paper subset, and the full Scholar-KG is accessible via the SCP link below. The same pipeline can be extended to general-domain corpora and to schema-conformant data synthesis. Extensive experiments demonstrate that Agents-K1 achieves superior performance in scientific information extraction, knowledge graph construction, and multi-hop scientific reasoning.
- Abstract(参考訳): 現在のLLMベースの研究エージェントは、エージェントオーケストレーションを通じて進歩しているが、ほとんど科学知識オーケストレーションを見落としている。
既存の研究はしばしば論文を抽象論、表面の言及、平らな \texttt{cites} エッジに還元し、重要な実体、主張、証拠、メカニズム、そして科学的推論に不可欠な方法の系統を省略する。
この目的のために、生文書をエージェントネイティブな科学知識グラフに変換するエンドツーエンドの知識オーケストレーションパイプラインである \textbf{Agents-K1} を紹介する。
Agents-K1は3つのコンポーネントを統合理論の基礎の下に統合する: 5モジュールのスキーマがエンティティ、マルチモーダルエビデンス、引用、型付き相互関係を抽出するマルチモーダルパーサ、ルールベースの報酬の下でGRPOでトレーニングされた4B情報抽出バックボーン、Web検索、マルチモーダルグラフ検索、クロスドキュメントトラバーサルを統一する3ソースエージェントインターフェースであるGraphanything CLI。
これに加えて、6つの被験者にわたる2,46万件の科学論文を処理して、100万枚の論文を公開し、以下のScholar-KGのリンクを通じて完全なScholar-KGがアクセス可能である。
同じパイプラインを汎用ドメインコーパスやスキーマに適合したデータ合成に拡張することができる。
広範囲にわたる実験により、エージェントK1は科学情報抽出、知識グラフ構築、マルチホップ科学推論において優れた性能を発揮することが示された。
関連論文リスト
- PARNESS: A Paper Harness for End-to-End Automated Scientific Research with Dynamic Workflows, Full-Text Indexing, and Cross-Run Knowledge Accumulation [20.481096196724398]
最近の自律型研究システムでは、LSMエージェントは実験を思いつき、実行し、論文を書くことができる。
この剛性には5つの根源がある、と我々は主張する。
提案するPARNESSは,4つの設計手順に基づいて構築されたオープンソースフレームワークである。
論文 参考訳(メタデータ) (2026-05-06T04:37:02Z) - PaperScope: A Multi-Modal Multi-Document Benchmark for Agentic Deep Research Across Massive Scientific Papers [52.97586643334384]
本稿ではエージェントディープリサーチのベンチマークであるPaperScopeを紹介する。
3年にわたる2000以上のAI論文の知識グラフ上に構築されている。
意味的に関連するキー情報ノードを統合し、最適化されたランダムウォーク記事セレクタを使用する。
論文 参考訳(メタデータ) (2026-04-13T11:07:08Z) - Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework [82.66443886385125]
ペーパーサークル(Paper Circle)は、学術文献の発見、評価、整理、理解に必要な労力を減らすために設計された発見・分析システムである。
1)複数のソースからのオフラインおよびオンライン検索を統合するディスカバリパイプライン,多エージェントスコアリング,多様性対応ランキング,構造化アウトプット,2)個々の論文を概念,メソッド,数値などの型付きノードで構造化された知識グラフに変換する分析パイプライン,の2つの補完パイプラインで構成されている。
論文 参考訳(メタデータ) (2026-04-07T17:59:58Z) - SciMDR: Benchmarking and Advancing Scientific Multimodal Document Reasoning [59.93568326270048]
集中セグメント上での忠実で孤立したQAペアを生成する合成合成フレームワークを提案する。
クロスモーダル理解のための大規模トレーニングデータセットであるSciMDRを構築した。
実験により、SciMDRモデルは複数の科学的QAベンチマークで大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2026-03-12T17:57:52Z) - Triples and Knowledge-Infused Embeddings for Clustering and Classification of Scientific Documents [2.115174610040722]
構造化された知識、特に主観的述語・対象三重項が、科学論文のクラスタリングと分類をいかに強化するかを考察する。
複数の文書表現に対する教師なしクラスタリングと教師なし分類を組み合わせたモジュールパイプラインを提案する。
その結果,完全抽象文は最も一貫性のあるクラスタを生成するが,三重項を組み込んだハイブリッド表現は分類性能を一貫して向上させることがわかった。
論文 参考訳(メタデータ) (2025-12-19T20:17:34Z) - ResearchPulse: Building Method-Experiment Chains through Multi-Document Scientific Inference [19.363580418167114]
我々は、関連論文のモチベーション、方法論、実験結果を抽出し、調整する新しいタスクである、多文書科学的推論を定式化する。
提案するResearchPulseは,指導計画,科学コンテンツ抽出,構造化可視化を統合したエージェントベースのフレームワークである。
このタスクを支援するために、注釈付き紙クラスターの引用対応ベンチマークであるResearchPulse-Benchを紹介する。
論文 参考訳(メタデータ) (2025-09-03T15:45:03Z) - Enhancing Abstractive Summarization of Scientific Papers Using Structure Information [6.414732533433283]
本稿では,学術論文における構造的機能の自動認識を活用する2段階の抽象的要約フレームワークを提案する。
第1段階では,多くの学術論文から章題を標準化し,構造関数認識のための大規模データセットを構築した。
第2段階では、Longformerを用いて、セクション間のリッチなコンテキスト関係をキャプチャし、コンテキスト対応の要約を生成する。
論文 参考訳(メタデータ) (2025-05-20T10:34:45Z) - DocGenome: An Open Large-scale Scientific Document Benchmark for Training and Testing Multi-modal Large Language Models [63.466265039007816]
我々は、arXivオープンアクセスコミュニティの153の分野から500Kの科学文書を注釈付けして構築した構造化文書ベンチマークDocGenomeを提案する。
我々はDocGenomeの利点を実証するために広範な実験を行い、我々のベンチマークで大規模モデルの性能を客観的に評価した。
論文 参考訳(メタデータ) (2024-06-17T15:13:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。