論文の概要: Reasoner-Executor-Synthesizer: Scalable Agentic Architecture with Static O(1) Context Window
- arxiv url: http://arxiv.org/abs/2603.22367v1
- Date: Mon, 23 Mar 2026 05:16:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.103223
- Title: Reasoner-Executor-Synthesizer: Scalable Agentic Architecture with Static O(1) Context Window
- Title(参考訳): Reasoner-Executor-Synthesizer:静的O(1)コンテキストウィンドウを用いたスケーラブルなエージェントアーキテクチャ
- Authors: Ivan Dobrovolskyi,
- Abstract要約: 本稿では,意図解析,決定論的データ検索と集約,物語生成を分離した3層アーキテクチャを提案する。
100のベンチマークで、RESはデータセットが42,000か1630万の項目を含むかどうかに関わらず、平均トークンコストが1,574である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) deployed as autonomous agents commonly use Retrieval-Augmented Generation (RAG), feeding retrieved documents into the context window, which creates two problems: the risk of hallucination grows with context length, and token cost scales linearly with dataset size. We propose the Reasoner-Executor-Synthesizer (RES) architecture, a three-layer design that strictly separates intent parsing (Reasoner), deterministic data retrieval and aggregation (Executor), and narrative generation (Synthesizer). The Executor uses zero LLM tokens and passes only fixed-size statistical summaries to the Synthesizer. We formally prove that RES achieves O(1) token complexity with respect to dataset size, and validate this on ScholarSearch, a scholarly research assistant backed by the Crossref API (130M+ articles). Across 100 benchmark runs, RES achieves a mean token cost of 1,574 tokens regardless of whether the dataset contains 42,000 or 16.3 million articles. The architecture eliminates data hallucination by construction: the LLM never sees raw records. KEYWORDS LLM agents; agentic architecture; hallucination elimination; token optimization; context window; retrieval-augmented generation; deterministic execution; scholarly metadata; Crossref API; O(1) complexity.
- Abstract(参考訳): 自律エージェントとしてデプロイされる大規模言語モデル(LLM)は、一般的に、検索されたドキュメントをコンテキストウィンドウに入力し、幻覚のリスクはコンテキストの長さとともに増大し、トークンコストはデータセットサイズとともに線形にスケールする。
本稿では,Reasoner-Executor-Synthesizer(RES)アーキテクチャ,意図解析(Reasoner),決定論的データ検索・集約(Executor),物語生成(Synthesizer)を厳密に分離した3層設計を提案する。
ExecutorはゼロのLSMトークンを使用し、固定サイズの統計サマリーのみをSynthesizerに渡す。
我々は、RESがデータセットサイズに関してO(1)トークンの複雑さを達成できることを正式に証明し、Crossref API(130M+記事)が支援する学術研究アシスタントであるScholarSearch上でこれを検証した。
100のベンチマークで、RESはデータセットが42,000か1630万の項目を含むかどうかに関わらず、平均トークンコストが1,574である。
アーキテクチャは、データ幻覚を構築によって排除する。
KEYWORDS LLMエージェント、エージェントアーキテクチャ、幻覚除去、トークン最適化、コンテキストウィンドウ、検索拡張生成、決定的実行、学術メタデータ、クロスリーフAPI、O(1)複雑性。
関連論文リスト
- RAVEL: Reasoning Agents for Validating and Evaluating LLM Text Synthesis [78.32151470154422]
テスト担当者が自律的に設計し、典型的な合成操作を実行できるようにするためのエージェントフレームワークであるRAVELを紹介する。
C3EBenchは、プロの人間の文章から1,258個のサンプルを抽出したベンチマークである。
SOTA LLMを演算子としてRAVELを増強することにより、そのようなエージェントテキスト合成はLLMの推論能力に支配されていることがわかった。
論文 参考訳(メタデータ) (2026-02-28T14:47:34Z) - CorpusQA: A 10 Million Token Benchmark for Corpus-Level Analysis and Reasoning [48.56088080889236]
我々は、新しいデータ合成フレームワークによって生成された1000万のトークンをスケーリングする新しいベンチマークであるCorpusQAを紹介した。
合成データの微調整はLLMの一般的な長文推論能力を効果的に向上させることを示す。
メモリ拡張型エージェントアーキテクチャは,より堅牢な代替手段であることを示す。
論文 参考訳(メタデータ) (2026-01-21T12:52:30Z) - FABRIC: Framework for Agent-Based Realistic Intelligence Creation [3.940391073007047]
大規模言語モデル(LLM)はエージェントとしてますます多くデプロイされ、目標を分解し、ツールを実行し、動的環境で結果を検証することが期待されている。
本稿では,LLMのみを用いたエージェントデータの統一化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-20T18:20:22Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - Unsupervised Text Representation Learning via Instruction-Tuning for Zero-Shot Dense Retrieval [19.422003299376]
命令チューニングによる教師なしテキスト表現学習手法を提案する。
関連する合成クエリの表現によってコーパス表現を拡張できることを実証する。
我々は,全指標の平均ゼロショット検索性能を著しく改善した。
論文 参考訳(メタデータ) (2024-09-24T23:03:13Z) - SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。
その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T12:22:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。