論文の概要: OxyMake: A Formally-Specified, Content-Addressable Workflow Engine
- arxiv url: http://arxiv.org/abs/2606.20989v2
- Date: Tue, 23 Jun 2026 13:07:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.313569
- Title: OxyMake: A Formally-Specified, Content-Addressable Workflow Engine
- Title(参考訳): OxyMake: 形式化された、コンテンツ対応のワークフローエンジン
- Authors: Emmanuel Sérié,
- Abstract要約: Rustエンジンはプロキシをcontent-addressedキャッシュキーに置き換える。
仕様は宣言的かつ静的に解析可能であり、Makeルールモデルを保ち、Snakemakeパイプラインを直接ポートする。
実行は、協調的なクレーム/リコールプロトコルを介してデーモンフリーである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Make-lineage workflow runners decide whether a job must re-run from file-modification time (mtime, a timestamp) -- a broken proxy for the question that matters: did the content change? A git checkout, a tree copy, or a backup restore rewrites mtimes without touching content, forcing spurious re-execution; and in the reverse case -- when an output looks newer than its inputs but its content is stale -- the stale output is silently reused. (Snakemake 7's per-output provenance survives this churn, as local bookkeeping; GNU Make and pure-mtime fast paths are where it bites.) OxyMake, a single-binary Rust workflow engine, replaces the proxy with a content-addressed cache key: a BLAKE3 hash of rule source, input content, parameters, environment, and platform. Because the key is a pure function of these declared inputs, the caching decision survives mtime churn and travels across same-platform machines and shared caches. Phantom re-runs vanish for declared inputs (no sandbox: an undeclared input is invisible to the key). The spec stays declarative and statically parseable, keeping the Make rule model so Snakemake pipelines port directly. DAG resolution is an order of magnitude faster than Snakemake's on large graphs, but a cold end-to-end run is slower -- the price of content-addressed bookkeeping -- repaid several-fold on the warm re-run that caching exists to serve (exact figures, hardware, and a bundled reproducer are in the evaluation). Execution is daemon-free via a cooperative claim/reclaim protocol (sessions claim jobs, reclaiming stalled ones); today two sessions duplicate work safely rather than coordinate, and wiring the protocol as a hard execution gate is staged, not yet done. Cross-session safety is specified in TLA+ and model-checked over all interleavings for 2-3 sessions, assuming atomic state commits. A plan-of-record lockfile and NDJSON event stream record exactly what ran.
- Abstract(参考訳): メークラインジュワークフローのランナーは、ジョブがファイル修正時間(mtime, a timetamp)から再実行すべきかどうかを判断します。
gitチェックアウト、ツリーコピー、あるいはバックアップの復元は、コンテンツに触れることなくmtimeを書き換え、急激な再実行を強制する。
(Snakemake 7のアウトプット当たりの出所は、ローカルの簿記として、GNU Makeと純粋なmtime fast pathsが噛まれる場所である。)
単一バイナリのRustワークフローエンジンであるOxyMakeは、プロキシをコンテント適応キャッシュキー(BLAKE3ハッシュのルールソース、入力コンテンツ、パラメータ、環境、プラットフォーム)に置き換える。
キーはこれらの宣言された入力の純粋関数であるため、キャッシュ決定はmtimechurnに留まり、同じプラットフォームマシンと共有キャッシュを横断します。
Phantomは、宣言された入力(サンドボックス:宣言されていない入力はキーに見えない)のために、再び消滅する。
仕様は宣言的かつ静的に解析可能であり、Makeルールモデルを保ち、Snakemakeパイプラインを直接ポートする。
DAGの解像度は、大きなグラフ上のSnakemakeよりも桁違いに速いが、コールドエンド・ツー・エンドのラン -- コンテンツ適応型ブックキーピングの価格 -- は、キャッシュが存在する温かい再実行時に何倍も返済される(具体的な数字、ハードウェア、バンドルされた複製器が評価されている)。
実行は、協調的なクレーム/リユースプロトコル(セッションのクレームジョブ、停止したクレームのリユース)を通じてデーモンフリーであり、今日では2つのセッションがコーディネートではなく安全に複製され、プロトコルをハードな実行ゲートとして配線する。
クロスセッション安全性はTLA+で規定され、原子状態コミットを仮定して、2~3セッションですべてのインターリーブ上でモデルチェックされる。
Plan-of-recordロックファイルとNDJSONイベントストリームは、実行したことを正確に記録する。
関連論文リスト
- Execution-State Capsules: Graph-Bound Execution-State Checkpoint and Restore for Low-Latency, Small-Batch, On-Device Physical-AI Serving [0.5076419064097734]
我々は、低レイテンシ、小バッチ、デバイス上の物理AIサービスという、反対の体制について研究する。
完全復元可能な状態に対するグラフバウンドチェックポイントと復元機構である実行状態カプセルを導入する。
これにより、トークンアドレス付きKVフラグメントからグラフバウンド実行状態境界への再利用が実現される。
論文 参考訳(メタデータ) (2026-06-18T17:49:36Z) - OpenRath: Session-Centered Runtime State for Agent Systems [2.9568259440852]
OpenRathはマルチエージェント・マルチセッションシステムのためのPyTorchのようなプログラミングモデルである。
セッションはブランチ可能、検査可能、再生可能、バックエンド対応、構成可能である。
レポートは、プログラミングモデル、アーキテクチャ、監査されたマイルストーン、エビデンスプロトコルを提示する。
論文 参考訳(メタデータ) (2026-06-17T15:19:19Z) - Scaling Self-Evolving Agents via Parametric Memory [69.96398842169002]
既存のメモリ拡張LDMエージェントは、過去の経験をプロンプト空間にのみ保存する。
自己進化型パラメトリックメモリフレームワークである textttTMEM を導入する。
textttTMEMは、様々なモデルスケールで要約ベースのベースラインと検索ベースのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-06-03T07:18:31Z) - Leyline: KV Cache Directives for Agentic Inference [0.11099872871193028]
レイラインはエージェント編集のためのサーブサイドプリミティブである。
宣言的ディレクティブ4タプルは、編集対象と位置正当性を維持する方法とを分離する。
同じインターフェースを介してルーティングされる10行のトランケーション規則は、デバッグジャムにおいてエージェントの解率+14.3 ppを上昇させる。
論文 参考訳(メタデータ) (2026-05-31T07:13:15Z) - When to Think, When to Speak: Learning Disclosure Policies for LLM Reasoning [60.714416943748866]
シングルストリームの自己回帰インターフェースでは、同じトークンがモデル状態を更新し、不可逆的な公約を構成する。
そこで我々は,Side-by-Side (SxS) Interleaved Reasoningを導入する。
論文 参考訳(メタデータ) (2026-05-05T02:59:58Z) - DiscreteRTC: Discrete Diffusion Policies are Natural Asynchronous Executors [57.944744187489185]
外部修正をネイティブなアンマスクに置き換えるDiscreteRTCを提案する。
DiscreteRTCは、非同期のインペインティングのために0行のコードを実装するのが簡単で、スクラッチから生成したアクションに比べてわずか0.7倍の計算速度で推論が高速で、フローベースのRTCに比べて実世界の動的ピックタスクの成功率が50%向上した。
論文 参考訳(メタデータ) (2026-04-27T23:04:03Z) - When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning [50.486479460454866]
より安定かつ効率的な長文推論のための2つのテキスト制御ゲートを組み込んだGRU-Memを提案する。
GRU-Memは一般的に、最大400%の推論速度加速でバニラMemAgentを上回っている。
論文 参考訳(メタデータ) (2026-02-11T06:14:53Z) - CacheFlow: Compressive Streaming Memory for Efficient Long-Form Video Understanding [0.0]
CacheFlowは、Dynamic Token Droppingと長期メモリを組み合わせた、トレーニング不要のパイプラインである。
オンラインのフレーム単位の処理により、当社のアプローチはライブストリーミングVQAに基本的に適しています。
推測において、コンセンサスに基づく検索機構は、Top-Kで最も関連性の高いブロックのみを検索する。
論文 参考訳(メタデータ) (2025-11-17T17:56:14Z) - Auditable Early Stopping for Agentic Routing: Ledger-Verified Run-Wise Certificates under Local DP [0.0]
ツール・ユース・エージェントのための最優先ルータが、よい葉を欠くことなく探索を止められるようになれば、私たちは対処します。
本稿では,各ノードのキーを,葉の摂動を実現する指数関数レースに結合するランワイズ証明書を提案する。
合成グラフと小さな実パイプラインの実験は、厳密な停止、決定論的リプレイ、オーバーヘッドの低さを示している。
論文 参考訳(メタデータ) (2025-09-09T01:25:09Z) - vCache: Verified Semantic Prompt Caching [95.16654660556975]
本稿では,ユーザ定義エラー率保証を備えた最初の検証済みセマンティックキャッシュであるvCacheを提案する。
オンライン学習アルゴリズムを使用して、キャッシュされたプロンプト毎に最適な閾値を推定し、追加のトレーニングなしで信頼性の高いキャッシュ応答を可能にする。
我々の実験によると、vCacheは特定のエラー境界を一貫して満たし、最先端の静的な閾値と微調整された埋め込みベースラインより優れています。
論文 参考訳(メタデータ) (2025-02-06T04:16:20Z) - Get More with LESS: Synthesizing Recurrence with KV Cache Compression for Efficient LLM Inference [78.65321721142624]
我々はキー値(KV)キャッシュによって課されるメモリボトルネックに焦点を当てる。
既存のKVキャッシュ手法は、比較的重要でないKVペアの大きなスワストを刈り取ったり、取り除いたりすることでこの問題に対処する。
本稿では,固定サイズキャッシュと退避型キャッシュを簡易に統合したLESSを提案する。
論文 参考訳(メタデータ) (2024-02-14T18:54:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。