論文の概要: MOOSEnger -- a Domain-Specific AI Agent for the MOOSE Ecosystem
- arxiv url: http://arxiv.org/abs/2603.04756v1
- Date: Thu, 05 Mar 2026 03:06:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.047871
- Title: MOOSEnger -- a Domain-Specific AI Agent for the MOOSE Ecosystem
- Title(参考訳): MOOSEnger - MOOSEエコシステムのためのドメイン特化AIエージェント
- Authors: Mengnan Li, Jason Miller, Zachary Prince, Alexander Lindsay, Cody Permann,
- Abstract要約: MOOSEngerはMultiphysics Object-Oriented Simulation Environment(MOOSE)に合わせたツール対応AIエージェントである。
自然言語インテントを実行可能インプットに変換し、キュレートされたドキュメント/例に対する検索拡張生成と決定論的、MOOSE対応のパース、バリデーション、実行ツールを組み合わせる。
- 参考スコア(独自算出の注目度): 38.627314894173296
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: MOOSEnger is a tool-enabled AI agent tailored to the Multiphysics Object-Oriented Simulation Environment (MOOSE). MOOSE cases are specified in HIT ".i" input files; the large object catalog and strict syntax make initial setup and debugging slow. MOOSEnger offers a conversational workflow that turns natural-language intent into runnable inputs by combining retrieval-augmented generation over curated docs/examples with deterministic, MOOSE-aware parsing, validation, and execution tools. A core-plus-domain architecture separates reusable agent infrastructure (configuration, registries, tool dispatch, retrieval services, persistence, and evaluation) from a MOOSE plugin that adds HIT-based parsing, syntax-preserving ingestion of input files, and domain-specific utilities for input repair and checking. An input precheck pipeline removes hidden formatting artifacts, fixes malformed HIT structure with a bounded grammar-constrained loop, and resolves invalid object types via similarity search over an application syntax registry. Inputs are then validated and optionally smoke-tested with the MOOSE runtime in the loop via an MCP-backed execution backend (with local fallback), translating solver diagnostics into iterative verify-and-correct updates. Built-in evaluation reports RAG metrics (faithfulness, relevancy, context precision/recall) and end-to-end success by actual execution. On a 125-prompt benchmark spanning diffusion, transient heat conduction, solid mechanics, porous flow, and incompressible Navier--Stokes, MOOSEnger achieves a 0.93 execution pass rate versus 0.08 for an LLM-only baseline.
- Abstract(参考訳): MOOSEngerは、Multiphysics Object-Oriented Simulation Environment(MOOSE)に合わせたツール対応AIエージェントである。
MOOSE のケースは HIT ".i" 入力ファイルで指定されており、大きなオブジェクトカタログと厳密な構文は初期設定とデバッグを遅くする。
MOOSEngerは、自然言語インテントを実行可能な入力に変換するための会話ワークフローを提供する。
コアプラスドメインアーキテクチャは、再利用可能なエージェントインフラストラクチャ(設定、レジストリ、ツールディスパッチ、検索サービス、永続化、評価)を、HITベースの解析、入力ファイルの構文保存の取り込み、入力の修復とチェックのためのドメイン固有のユーティリティを追加するMOOSEプラグインから分離する。
入力プレチェックパイプラインは、隠されたフォーマットのアーティファクトを削除し、境界付き文法制約ループで不正なHIT構造を修正し、アプリケーション構文レジストリの類似性検索を通じて無効なオブジェクトタイプを解決します。
入力は検証され、MPPが支援する実行バックエンド(ローカルフォールバックを含む)を介してループ内のMOOSEランタイムで任意にスモークテストされ、ソルバ診断を反復的な検証と修正の更新に変換する。
組み込み評価では、RAGメトリクス(信頼度、関連性、コンテキスト精度/リコール)と、実際の実行によるエンドツーエンドの成功を報告します。
拡散、過渡熱伝導、固体力学、多孔質流、圧縮不能なナビエ-ストークスにまたがる125プロンプトのベンチマークでは、MOOSEnger は LLM のみのベースラインに対して 0.93 実行パス率対 0.08 を達成する。
関連論文リスト
- Beyond Input Guardrails: Reconstructing Cross-Agent Semantic Flows for Execution-Aware Attack Detection [32.301679396929536]
静的な入力フィルタリングから実行対応分析へ、防御パラダイムをシフトするフレームワークであるSysNameを提案する。
SysNameは断片化された操作プリミティブを連続した行動軌跡に合成し、システムアクティビティの全体像を可能にする。
実証的な評価により、SysNameは10以上の異なる複合攻撃ベクトルを効果的に検出し、それぞれノードレベルとパスレベルのエンドツーエンド攻撃検出に対して85.3%と66.7%のF1スコアを達成した。
論文 参考訳(メタデータ) (2026-03-04T01:59:16Z) - REGAL: A Registry-Driven Architecture for Deterministic Grounding of Agentic AI in Enterprise Telemetry [0.0]
大規模言語モデル(LLM)は、エージェント自動化の新しい形態を可能にする。
本稿では,企業テレメトリにおけるエージェントAIシステムの決定論的基盤化のためのレジストリ駆動型アーキテクチャREGALを提案する。
論文 参考訳(メタデータ) (2026-03-03T14:13:39Z) - Prism: Efficient Test-Time Scaling via Hierarchical Search and Self-Verification for Discrete Diffusion Language Models [96.0074341403456]
LLM推論を改善するための実用的な方法として、推論時計算が再導入されている。
テスト時間スケーリング(TTS)アルゴリズムの多くは、自動回帰デコーディングに依存している。
そこで我々は,dLLM のための効率的な TTS フレームワーク Prism を提案する。
論文 参考訳(メタデータ) (2026-02-02T09:14:51Z) - Veri-Sure: A Contract-Aware Multi-Agent Framework with Temporal Tracing and Formal Verification for Correct RTL Code Generation [4.723302382132762]
シリコングレードの正しさは、 (i) シミュレーション中心の評価の限られたカバレッジと信頼性、 (ii) 回帰と修復幻覚、 (iii) エージェントハンドオフ間で意図が再解釈される意味的ドリフトによってボトルネックが残っている。
エージェントの意図を整合させる設計契約を確立するマルチエージェントフレームワークであるVeri-Sureを提案する。
論文 参考訳(メタデータ) (2026-01-27T16:10:23Z) - The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check [54.08619694620588]
本稿では,2つの異なるエージェントパラダイムであるEmbodied AgentsとTool-Calling AgentsにまたがるdLLMの包括的評価を行う。
Agentboard と BFCL では,現在の dLLM が信頼できるエージェントバックボーンとして機能しないという,"ビットレッスン" が報告されている。
論文 参考訳(メタデータ) (2026-01-19T11:45:39Z) - Hybrid Fuzzing with LLM-Guided Input Mutation and Semantic Feedback [0.0]
本稿では,静的および動的解析をLarge Language Model(LLM)誘導入力変異と意味フィードバックと統合したハイブリッドファジリングフレームワークを提案する。
本手法は,最先端のファジィよりも高速な時間対第一のバグ,意味的多様性の向上,およびユニークなバグの競合数を実現する。
論文 参考訳(メタデータ) (2025-11-06T02:38:24Z) - Align Your Query: Representation Alignment for Multimodality Medical Object Detection [55.86070915426998]
本稿では,表現をモダリティの文脈と整合させる検出非依存の枠組みを提案する。
モーダリティトークンをマルチモーダリティコンテキスト注意による検出プロセスに統合する。
提案されたアプローチは、最小限のオーバーヘッドとアーキテクチャの変更を伴わず、APを継続的に改善する。
論文 参考訳(メタデータ) (2025-10-03T07:49:21Z) - How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.114899897566964]
マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。
本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。
IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文 参考訳(メタデータ) (2025-08-28T15:57:33Z) - PARALLELPROMPT: Extracting Parallelism from Large Language Model Queries [19.780108308260214]
本稿では,自然ユーザプロンプトにおけるクエリ内並列性を測定する最初のベンチマークであるPARALLELPROMPTを紹介する。
我々のデータセットは、パブリックなLLMチャットログから37,000以上の実世界のプロンプトで構成されています。
並列戦略とシリアル戦略をベンチマークし、レイテンシ、構造的忠実度、セマンティック忠実度を計測する実行スイートを提供する。
論文 参考訳(メタデータ) (2025-06-23T15:05:54Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。