論文の概要: NormCode Canvas: Making LLM Agentic Workflows Development Sustainable via Case-Based Reasoning
- arxiv url: http://arxiv.org/abs/2603.13443v1
- Date: Fri, 13 Mar 2026 12:59:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.212404
- Title: NormCode Canvas: Making LLM Agentic Workflows Development Sustainable via Case-Based Reasoning
- Title(参考訳): NormCode Canvas: ケースベースの推論によるLLMエージェントワークフロー開発の実現
- Authors: Xin Guan, Yunshan Li, Ze Wang,
- Abstract要約: NormCode Canvas (v1.1.3) は,多段階LLMのためのケースベース推論を2段階で実現したシステムである。
NormCodeは、コンパイラが検証したスコープルールで、すべての実行チェックポイントが自己完結したケースであることを保証している半形式的な計画言語である。
- 参考スコア(独自算出の注目度): 7.256501967124123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present NormCode Canvas (v1.1.3), a deployed system realizing Case-Based Reasoning at two levels for multi-step LLM workflows. The foundation is NormCode, a semi-formal planning language whose compiler-verified scope rule ensures every execution checkpoint is a genuinely self-contained case -- eliminating the implicit shared state that makes retrieval unreliable and failure non-localizable in standard orchestration frameworks. Level 1 treats each checkpoint as a concrete case (suspended runtime); Fork implements retrieve-and-reuse, Value Override implements revision with automatic stale-boundary propagation. Level 2 treats each compiled plan as an abstract case; the compilation pipeline is itself a NormCode plan, enabling recursive case learning. Three structural properties follow: (C1) direct checkpoint inspection; (C2) pre-execution review via compiler-generated narrative; (C3) scope-bounded selective re-execution. Four deployed plans serve as structured evidence: PPT Generation produces presentation decks at ~40s per slide on commercial APIs; Code Assistant carries out multi-step software-engineering tasks spanning up to ten reasoning cycles; NC Compilations converts natural-language specifications into executable NormCode plans; and Canvas Assistant, when connected to an external AI code editor, automates plan debugging. Together these plans form a self-sustaining ecosystem in which plans produce, debug, and refine one another -- realizing cumulative case-based learning at system scale.
- Abstract(参考訳): NormCode Canvas (v1.1.3) は,多段階LLMワークフローのためのケースベース推論を2段階で実現したデプロイシステムである。
NormCodeは、コンパイラが検証したスコープルールで、すべての実行チェックポイントが真に自己完結したケースであることを保証している、半形式的な計画言語である。
レベル1は、各チェックポイントを具体的ケース(サスペンドランタイム)として扱い、Forkは、検索と再利用を実装し、Value Overrideは、自動ステールバウンダリ伝搬によるリビジョンを実装している。
コンパイルパイプライン自体がNormCodeプランであり、再帰的なケース学習を可能にする。
C1)直接チェックポイントインスペクション、(C2)コンパイラ生成の物語による事前実行レビュー、(C3)スコープ境界の選択的再実行である。
PPT生成は商用API上で1スライドあたり40秒程度のプレゼンテーションデッキを生成する。Code Assistantは10の推論サイクルにまたがるマルチステップのソフトウェアエンジニアリングタスクを実行する。NCコンパイラは自然言語仕様をNormCodeプランに変換する。
これらの計画が組み合わさって、システム規模で累積的なケースベースの学習を実現する、計画の生成、デバッグ、洗練という、自己持続的なエコシステムを形成します。
関連論文リスト
- LLM-Augmented Release Intelligence: Automated Change Summarization and Impact Analysis in Cloud-Native CI/CD Pipelines [0.0]
クラウドネイティブなソフトウェアデリバリプラットフォームは、数十の独立したバージョン管理タスクで構成される複雑なマルチステージパイプラインを通じて、リリースをオーケストレーションする。
このようなリリースコミュニケーションのマニュアル準備は遅く、一貫性がなく、特にリポジトリではエラーが発生します。
1) 自動コミット収集とセマンティックフィルタリングを併用して,定期的なメンテナンスを抑えながら実体的変化を表面化する,(2) 階層化された大規模言語モデル要約による分類,利害関係者指向のプロモーションレポートの生成,(3) 修正タスクを参加者が参加するパイプライン毎にマップする静的タスク-パイプライン依存性分析, そして各変更のブラスト半径を定量化する,という3つの機能を組み合わせたAI強化リリースインテリジェンスのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-15T21:30:52Z) - SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation [1.0010193170880752]
本稿では,高レベルのプログラム意図とポインタ演算と手動メモリ管理の厳密な構文制約とのギャップを埋める,ニューロシンボリックなシナリオベースのフレームワークを提案する。
我々は、59の現実世界およびアルゴリズムの被験者で評価し、バニラプロンプト生成ベースラインを31.36%、分岐カバレッジ26.01%、突然変異スコア20.78%で上回り、シンボリック実行ツールKLEEに適合または超えている。
論文 参考訳(メタデータ) (2026-02-18T18:09:03Z) - Environment-Aware Code Generation: How far are We? [52.69113158357018]
大規模言語モデル(LLM)がユーザの特定の環境に適した実行可能コードを確実に生成できるかどうかは不明である。
本稿では,環境対応コード生成(EACG)の最初の体系的研究について述べる。
その結果,現在のLLMは環境固有のコード生成に苦しむ一方で,環境の適合性や実行性も向上していることがわかった。
論文 参考訳(メタデータ) (2026-01-18T04:58:15Z) - NormCode: A Semi-Formal Language for Context-Isolated AI Planning [7.3226942109207895]
推論計画を構築するための半形式言語であるNormCodeを提示する。
各ステップはデータ分離で動作し、明示的に渡された入力のみを受け取り、設計によるクロスステップ汚染を排除します。
我々は,(1)任意の長さの入力に対して100%の精度を達成するベースX加算アルゴリズム,(2)NormCode自身の5フェーズコンパイラパイプラインの自己ホスト実行の2つのデモを通じて,NormCodeを検証する。
論文 参考訳(メタデータ) (2025-12-11T11:50:50Z) - SPARE: Single-Pass Annotation with Reference-Guided Evaluation for Automatic Process Supervision and Reward Modelling [58.05959902776133]
私たちはSingle-Passを紹介します。
Reference-Guided Evaluation (SPARE)は、効率的なステップごとのアノテーションを可能にする新しい構造化フレームワークである。
数学的推論(GSM8K, MATH)、マルチホップ質問応答(MuSiQue-Ans)、空間推論(SpaRP)にまたがる4つの多様なデータセットにおけるSPAREの有効性を実証する。
ProcessBenchでは、SPAREがデータ効率のよいアウト・オブ・ディストリビューションの一般化を実証し、トレーニングサンプルの$sim$16%しか使用していない。
論文 参考訳(メタデータ) (2025-06-18T14:37:59Z) - Self-Steering Language Models [113.96916935955842]
DisCIPL は "self-steering" 言語モデル (LM) の手法である。
DisCIPLは、Followerモデルの集団によって実行されるタスク固有の推論プログラムを生成する。
我々の研究は、高度に並列化されたモンテカルロ推論戦略の設計空間を開く。
論文 参考訳(メタデータ) (2025-04-09T17:54:22Z) - Test-Time Alignment for Large Language Models via Textual Model Predictive Control [63.508812485566374]
Textual Model Predictive Control (TMPC) は、推論時に大規模言語モデルを調整するために適応された新しい予測計画フレームワークである。
TMPCは、談話レベル翻訳、長文応答生成、プログラム合成の3つの異なるセグメンテーション特性を持つタスクで評価される。
その結果、TMPCはパフォーマンスを継続的に改善し、一般性を強調している。
論文 参考訳(メタデータ) (2025-02-28T07:24:33Z) - ExecRepoBench: Multi-level Executable Code Completion Evaluation [45.963424627710765]
本稿では,リポジトリレベルのベンチマークであるExecRepoBenchの作成を通じて,ソフトウェア開発におけるコード補完を強化する新しいフレームワークを紹介する。
本稿では,抽象構文木をベースとした多段階文法ベースの補完手法を提案し,様々な論理単位のコードフラグメントをマスキングする。
次に,Repo-Instruct の 7B パラメータでオープンソースの LLM を微調整し,強力なコード補完ベースラインモデル Qwen2.5-Coder-Instruct-C を生成する。
論文 参考訳(メタデータ) (2024-12-16T17:14:35Z) - AutoPLC: Generating Vendor-Aware Structured Text for Programmable Logic Controllers [9.209415852653386]
AutoPLCは、ベンダーが認識するSTコードを自動的に自然言語要求から生成できるフレームワークである。
Siemens TIA PortalとCODESYSプラットフォーム向けに実装されている。
AutoPLCは914タスクベンチマークで90%以上のコンパイル成功を実現しています。
論文 参考訳(メタデータ) (2024-12-03T12:05:56Z) - Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。