論文の概要: Intermediate Artifacts as First-Class Citizens: A Data Model for Durable Intermediate Artifacts in Agentic Systems
- arxiv url: http://arxiv.org/abs/2605.12087v1
- Date: Tue, 12 May 2026 13:09:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.87491
- Title: Intermediate Artifacts as First-Class Citizens: A Data Model for Durable Intermediate Artifacts in Agentic Systems
- Title(参考訳): ファーストクラス市民としての中間アーティファクト:エージェントシステムにおける耐久性のある中間アーティファクトのデータモデル
- Authors: Josh Rosen, Seth Rosen,
- Abstract要約: このようなシステムは、耐久性があり、検査可能な中間アーティファクトを保存すべきである、と我々は主張する。
中間成果物をチャットの書き起こし、記憶、隠された思考の連鎖、ナレーション、思考、最終回答と区別する。
耐久性のある中間アーティファクトは、AI生成された作業をより検査可能で、修正可能で、時間の経過とともに保守可能にします。
- 参考スコア(独自算出の注目度): 0.10312968200748114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many AI systems are organized around loops in which models reason, call tools, observe results, and continue until a task is complete. These systems often produce final artifacts such as memos, plans, recommendations, and analyses, while the intermediate work that shaped those outputs remains ephemeral. For multi-step, revisable AI work, final artifacts are often lossy projections over upstream state. We argue that such systems should preserve durable, inspectable intermediate artifacts: typed, structured, addressable, versioned, dependency-aware, authoritative, and consumable by downstream computation. These artifacts are not the model's private chain-of-thought. They are maintained work products such as evidence maps, claim structures, criteria, assumptions, plans, transformation rules, synthesis procedures, unresolved tensions, and partial products that later humans and agents can inspect, revise, supersede, and improve. The contribution is a systems-level data model. We distinguish intermediate artifacts from chat transcripts, memory, hidden chain-of-thought, narration, thinking, and final answers; formalize additive and superseding update semantics with explicit current-state resolution; describe how artifact lineage supports durable intermediate state across revisions; and argue that evaluation must target maintained-state quality, not only final-output quality. The claim is not that artifacts make models smarter. It is that durable intermediate artifacts make AI-generated work more inspectable, revisable, and maintainable over time.
- Abstract(参考訳): 多くのAIシステムは、モデルが推論し、ツールを呼び、結果を観察し、タスクが完了するまで継続するループを中心に構成されている。
これらのシステムはしばしばメモ、計画、レコメンデーション、分析などの最終成果物を生成するが、それらの成果を形作る中間的な作業は短命のままである。
マルチステップで修正可能なAI作業では、最終成果物はしばしば上流状態に対する損失のあるプロジェクションである。
このようなシステムは、型付け、構造化、アドレス付け、バージョン管理、依存性認識、権威、ダウンストリーム計算による消費が可能な、耐久性のある検査可能な中間アーティファクトを保存すべきである、と我々は主張する。
これらのアーティファクトは、モデルのプライベートチェーンではない。
それらはエビデンスマップ、クレーム構造、基準、仮定、計画、変換規則、合成手順、未解決の緊張、そして後に人間やエージェントが検査、修正、監督、改善できる部分的な製品である。
コントリビューションはシステムレベルのデータモデルです。
我々は、中間アーティファクトをチャットの書き起こし、記憶、隠された連鎖、ナレーション、思考、最終回答と区別し、加法的および代用的な更新セマンティクスを明示的な現状解決で形式化し、アーティファクトの系統がリビジョン全体にわたって耐久性のある中間状態をサポートする方法を記述し、評価は最終出力品質だけでなく、維持状態の品質を目標とする必要があると主張している。
この主張は、アーティファクトがモデルをより賢くするわけではない。
耐久性のある中間アーティファクトは、AI生成された作業をより検査可能で、修正可能で、時間の経過とともに保守可能にします。
関連論文リスト
- From Agent Loops to Deterministic Graphs: Execution Lineage for Reproducible AI-Native Work [0.10312968200748114]
本稿では,AIネイティブな作業が人工物生成計算の有向非巡回グラフ(DAG)として表現される実行モデルを提案する。
制御された2つのポリシーメモ更新タスクにおいて、ループ中心の更新ベースラインに対する実行行リプレイを比較した。
論文 参考訳(メタデータ) (2026-05-07T14:39:37Z) - Visual Generation in the New Era: An Evolution from Atomic Mapping to Agentic World Modeling [183.5907213030813]
我々は、この分野は外観合成を超えて知的視覚生成へと進むべきであると論じている。
本稿では, 原子生成, 条件生成, インコンテキスト生成, エージェント生成, 世界モデル生成という5段階の分類法を紹介する。
我々は、フローマッチング、統合された理解・生成モデル、視覚表現の改善、後トレーニング、報酬モデリング、データキュレーション、サンプリングアクセラレーションなど、主要な技術ドライバを解析する。
論文 参考訳(メタデータ) (2026-04-30T17:59:02Z) - Gypscie: A Cross-Platform AI Artifact Management System [0.6784745592354215]
我々は,クロスプラットフォームAIアーティファクト管理システムであるGypscieを紹介する。
すべてのAIアーティファクトの統一ビューを提供することで、GypscieはAIアプリケーションの開発とデプロイを簡単にする。
論文 参考訳(メタデータ) (2026-04-11T18:24:26Z) - FORGE: Fine-grained Multimodal Evaluation for Manufacturing Scenarios [58.34124792457706]
製造業セクターは、単純な認識から自律的な実行に移行するために、MLLM(Multimodal Large Language Models)をますます採用している。
進捗は、データの不足と、既存のデータセットにおけるきめ細かいドメインセマンティクスの欠如によって妨げられている。
まず、実世界の2D画像と3Dポイントクラウドを組み合わせて、微粒なドメインセマンティクスを付加した高品質なデータセットを構築します。
次に, 3 つの製造課題,すなわち, 構造面検査, 組立検査, 組立検証の18の最先端MLLMを評価し, 大幅な性能差を明らかにした。
論文 参考訳(メタデータ) (2026-04-08T12:23:27Z) - AI-Supervisor: Autonomous AI Research Supervision via a Persistent Research World Model [1.14219428942199]
既存の自動研究システムは、ステートレスでリニアなパイプラインとして動作する。
マルチエージェントオーケストレーションフレームワークである textbfAI-Supervisor を提案する。
エージェントは、人間の関心によって駆動されるエンドツーエンドのAI研究の監督を提供する。
論文 参考訳(メタデータ) (2026-03-25T15:16:51Z) - See and Fix the Flaws: Enabling VLMs and Diffusion Models to Comprehend Visual Artifacts via Agentic Data Synthesis [17.896266572037348]
ArtiAgentは、リアルイメージとアーティファクトインジェクトイメージのペアを効率よく生成する。
実際の画像から実体やサブエンティティを認識する知覚エージェント、アーティファクト注入ツールを介してアーティファクトを導入する合成エージェント、合成アーティファクトをフィルタリングするキュレーションエージェントの3つからなる。
論文 参考訳(メタデータ) (2026-02-24T14:34:13Z) - Resolving Evidence Sparsity: Agentic Context Engineering for Long-Document Understanding [49.26132236798123]
視覚言語モデル(VLM)は、文書理解における主要なアプローチになりつつある。
本稿では,粗いプロセスにおいて,検索者と4つの協調エージェントを編成するマルチエージェントフレームワークSLEUTHを提案する。
このフレームワークは、検索したページ内の重要なテキストおよび視覚的手がかりを特定し、テーブルやチャートなどの健全な視覚的エビデンスをフィルタし、クエリを分析して推論戦略を考案する。
論文 参考訳(メタデータ) (2025-11-28T03:09:40Z) - EdiVal-Agent: An Object-Centric Framework for Automated, Fine-Grained Evaluation of Multi-Turn Editing [170.71134330650796]
EdiVal-Agentは、命令ベースの画像編集のためのオブジェクト指向評価フレームワークである。
標準のシングルターンだけでなく、マルチターンの命令ベースの編集を精度良く評価するように設計されている。
EdiVal-Benchは、インコンテキスト、フローマッチング、拡散パラダイムにまたがる9つの命令タイプと13の最先端編集モデルをカバーするベンチマークである。
論文 参考訳(メタデータ) (2025-09-16T17:45:39Z) - Trust at Your Own Peril: A Mixed Methods Exploration of the Ability of Large Language Models to Generate Expert-Like Systems Engineering Artifacts and a Characterization of Failure Modes [0.0]
そこでは,人間の専門家が作成したSEアーティファクトをベンチマークとして用いた経験的探索の結果を報告する。
次に、AI生成されたアーティファクトとベンチマークを比較するために、2倍の混合メソッドアプローチを採用しました。
2つの素材は非常に似ているように見えるが、AIが生成したアーティファクトは深刻な障害モードを示しており、検出は困難である。
論文 参考訳(メタデータ) (2025-02-13T17:05:18Z) - TRIAD: Automated Traceability Recovery based on Biterm-enhanced
Deduction of Transitive Links among Artifacts [53.92293118080274]
トレーサビリティにより、ステークホルダは、ソフトウェアライフサイクル全体で導入されたソフトウェアアーティファクト間のトレースリンクを抽出し、理解することができます。
ほとんどの場合、Information Retrieval (IR) など、ソフトウェアアーティファクト間のテキストの類似性に依存している。
論文 参考訳(メタデータ) (2023-12-28T06:44:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。