論文の概要: A Constrained Natural-Language Interface for Variational Multi-Physics Finite Element Simulations in FEniCS
- arxiv url: http://arxiv.org/abs/2606.10928v1
- Date: Tue, 09 Jun 2026 14:38:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.553678
- Title: A Constrained Natural-Language Interface for Variational Multi-Physics Finite Element Simulations in FEniCS
- Title(参考訳): FEniCSにおける可変多相有限要素シミュレーションのための制約付き自然言語インタフェース
- Authors: Nilay Upadhyay, Wesley F. Reinhart,
- Abstract要約: 本稿では,LLMをフロントエンドタスクに限定した制約付き自然言語生成有限要素解析を提案する。
FEniCSソルバテンプレートを書いたり、弱い形式を導いたり、数値ソルバコアを書いたりすることはない。
エンド・ツー・エンドのデモンストレーションとして、システムは1つの自然言語プロンプトからフィレットとボルトホールを備えた3次元弾塑性Lブラケットを生成し、分析する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models can reduce the manual effort required to set up finite element simulations, but they introduce reliability risks when generated solver code lies on the critical path. We present a constrained natural-language interface for multi-physics finite element analysis in which the LLM is limited to front-end tasks: parsing prompts into structured JSON, generating Gmsh code only for non-catalog geometries, and using retry feedback for those stages. It never writes FEniCS solver templates, derives weak forms, or writes the numerical solver core. A deterministic dispatcher maps the validated specification to five human-written FEniCS/UFL templates: linear elasticity, hyperelasticity, elastoplasticity, thermo-mechanical coupling, and phase-field fracture. We validate this deterministic template layer against analytical solutions and published 2D/3D benchmarks. Smooth cases reach sub-percent agreement on adequate meshes, while harder nonlinear cases reach the 2-5 percent range. We also evaluate the LLM-facing front end directly. In a 15-prompt parser benchmark, first-pass valid parses were obtained for 9 cases, and all remaining cases were repaired after retry, giving a final valid parse rate of 100.0 percent, 100.0 percent problem-class accuracy, and 97.1 percent field-extraction accuracy. In a 10-case custom-geometry benchmark routed through the real LLM-to-Gmsh path, first-pass and final success were both 90.0 percent, with one unrecovered invalid-geometry failure. These results show that the parser and constrained prompt/validation design are effective on these benchmarks. As an end-to-end demonstration, the system generates and analyzes a 3D elastoplastic L-bracket with a fillet and bolt hole from one natural-language prompt. The contribution is a measured architecture for natural-language-driven variational simulation, not open-ended autonomous code generation.
- Abstract(参考訳): 大規模言語モデルは有限要素シミュレーションのセットアップに必要な手作業を減らすことができるが、生成したソルバコードが臨界経路上にある場合の信頼性リスクを導入する。
本稿では,複数物理有限要素解析のための制約付き自然言語インタフェースを提案する。LLMは,構造化されたJSONにプロンプトをパースし,Gmshコードを非触媒的ジオメトリにのみ生成し,それらのステージに対して再試行フィードバックを使用する。
FEniCSソルバテンプレートを書いたり、弱い形式を導いたり、数値ソルバコアを書いたりすることはない。
決定論的ディスパッチは、検証された仕様を線形弾性、超弾性、エラスト塑性、熱-機械的結合、位相場破壊の5つの人書きFEniCS/UFLテンプレートにマッピングする。
我々はこの決定論的テンプレート層を解析解に対して検証し、2D/3Dベンチマークを公表した。
スムースなケースは適切なメッシュ上で、スムースなケースは少なからぬ合意に達し、硬い非線形ケースは2~5パーセントの範囲に達します。
また,LLM面のフロントエンドを直接評価する。
15プロンプトパーサーのベンチマークでは、最初のパス有効パースを9件取得し、残りの全てのケースはリトライ後に修復され、最終的な有効パースレートは100.0%、問題クラス精度100.0%、フィールド抽出精度97.1%となった。
実際のLSM-to-Gmshパスをルーティングした10ケースのカスタムジオメトリのベンチマークでは、ファーストパスと最終成功はいずれも90.0%で、未発見の無効ジオメトリの失敗が1つあった。
これらの結果から, パーサと制約付きプロンプト/バリデーション設計がこれらのベンチマークに有効であることが示唆された。
エンド・ツー・エンドのデモンストレーションとして、システムは1つの自然言語プロンプトから、フィレットとボルトホールを備えた3次元弾塑性Lブラケットを生成し、分析する。
このコントリビューションは、自然言語駆動の変動シミュレーションのための測定アーキテクチャであり、オープンエンドの自律コード生成ではない。
関連論文リスト
- LinAlg-Bench: A Forensic Benchmark Revealing Structural Failure Modes in LLM Mathematical Reasoning [0.0]
LinAlg-Benchは、構造化線形代数計算における10のフロンティア大言語モデルを評価する診断ベンチマークである。
ベンチマークは、6600モデルのアウトプットを徹底的に評価する。
論文 参考訳(メタデータ) (2026-05-15T22:30:57Z) - LiveFMBench: Unveiling the Power and Limits of Agentic Workflows in Specification Generation [75.05397479715576]
大規模言語モデル(LLM)とエージェントは有望な進歩を示しているが、その真の能力と失敗モードは未だ不明である。
CプログラムのためのLCMおよびエージェントベースの形式仕様生成に関する、最初の体系的および汚染に配慮した研究を提案する。
論文 参考訳(メタデータ) (2026-05-02T11:31:33Z) - Omanic: Towards Step-wise Evaluation of Multi-hop Reasoning in Large Language Models [60.418191092851636]
OmanicはオープンドメインのマルチホップQAリソースであり、推論プロセスを分析するための構造アノテーションとして分解されたサブクエストと中間回答を提供する。
10,296個の機械によるトレーニング例(Omanic Synth)と967個の専門家による注釈付き評価例(OmanicBench)を含む。
論文 参考訳(メタデータ) (2026-03-17T15:23:37Z) - $\nabla$-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space [71.23672814629448]
$nabla$-Reasonerは、トークンログに対する差別化可能な最適化をデコードループに統合する反復生成フレームワークである。
$nabla$-Reasonerは、挑戦的な数学的推論ベンチマークで20%以上の精度の向上を実現している。
論文 参考訳(メタデータ) (2026-03-05T08:42:54Z) - Constructing Industrial-Scale Optimization Modeling Benchmark [26.61380804019141]
重要なボトルネックは、実際の最適化モデルに根ざした、自然言語仕様と参照定式化/解決コードとを一致させるベンチマークの欠如である。
実混合整数線形プログラムから構造を意識した逆構成手法により構築したMIPLIB-NLを提案する。
実験の結果,MIPLIB-NLは既存のベンチマークに強く依存するシステムに対して,大幅な性能低下を示した。
論文 参考訳(メタデータ) (2026-02-11T02:45:31Z) - Self-reflection in Automated Qualitative Coding: Improving Text Annotation through Secondary LLM Critique [1.5749416770494706]
大規模言語モデル(LLM)は、大規模なデータセットの高度な定性的な符号化を可能にする。
簡単な一般化可能な2段階のワークフローを提示する: LLMは人間設計のコードブックを適用し、二次LPM批評家は各正のラベルに対して自己回帰を行う。
我々は,Apache Software Foundationのプロジェクト評価に関する議論において,3,000件以上の高コンテンツメールに対する6つの定性的なコードに対して,このアプローチを評価した。
論文 参考訳(メタデータ) (2026-01-14T22:27:13Z) - Anka: A Domain-Specific Language for Reliable LLM Code Generation [0.0]
大規模言語モデル(LLM)は、複雑な多段階プログラミングタスクの体系的なエラーを示す。
明示的で制約のある構文で設計されたデータ変換パイプライン用のドメイン固有言語()であるAnkaを紹介します。
Ankaは100のベンチマーク問題に対して99.9%のパース成功と95.8%のタスク精度を達成した。
論文 参考訳(メタデータ) (2025-12-29T05:28:17Z) - Understanding Robustness of Model Editing in Code LLMs: An Empirical Study [1.5624785508022727]
本稿では,5つの最先端モデル編集手法の体系的研究を行う。
これらの手法を3つの主要なオープンソースコードLLM、CodeLlama、CodeQwen1.5、DeepSeek-Coderに適用する。
インスタント編集はモデル性能を常に劣化させ、構文的妥当性は86ポイントまで低下し、機能的正しさは最高のパフォーマンス設定でも45ポイントまで低下する。
論文 参考訳(メタデータ) (2025-11-05T04:58:13Z) - Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling [90.86991492288487]
トークンの制約を評価するのは 違法にコストがかかる
LCDは文字列上のグローバル分布を歪め、ローカル情報のみに基づいてトークンをサンプリングすることができる。
我々のアプローチは最先端のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-07T18:30:18Z) - Sample, Don't Search: Rethinking Test-Time Alignment for Language Models [55.2480439325792]
新しいテストタイムアライメントアプローチであるQAlignを紹介します。
テスト時間計算をスケールする際、QAlignは各プロンプトの最適配向分布からのサンプリングに収束する。
マルコフ連鎖モンテカルロのテキスト生成における最近の進歩を取り入れることで、基礎となるモデルを変更したり、ロジットアクセスを必要とせずに、より良い整合出力を可能にする。
論文 参考訳(メタデータ) (2025-04-04T00:41:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。