論文の概要: ProvMind: Provenance-grounded reasoning for materials synthesis
- arxiv url: http://arxiv.org/abs/2605.28487v1
- Date: Wed, 27 May 2026 13:44:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.086051
- Title: ProvMind: Provenance-grounded reasoning for materials synthesis
- Title(参考訳): ProvMind: 材料合成のためのプロヴァンス基底推論
- Authors: Yiming Zhang, Ryo Tamura, Koji Tsuda,
- Abstract要約: マトベンチ(MatBench)は、文献マイニングされたMatPROVグラフから構築された証明基底ベンチマークである。
また、類似のトレーニングプロセスを取得するプロセスメモリ推論フレームワークであるProvMindについても紹介する。
ProvMindは2つのOODスプリットに対して52.84%の精度を達成し、プロンプト、検索拡張および教師付き微調整ベースラインよりも優れていた。
- 参考スコア(独自算出の注目度): 2.681927508532972
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Materials process optimization requires reasoning over routes, conditions, tools and causal dependencies, yet most computational formulations flatten synthesis procedures into text or ordered steps. We introduce MatProcBench, a provenance-grounded benchmark constructed from literature-mined MatPROV graphs, to evaluate seven process-reasoning tasks spanning route continuity, step-level variable inference and global causal consistency under both same-split and shift-aware evaluation, including a strict dual-OOD split that combines temporal and material-class shift. We further introduce ProvMind, a process-memory reasoning framework that retrieves analogous training processes, converts them into provenance-aware option-level compatibility scores, and uses a language model for constrained final decision making. ProvMind achieves 52.84\% accuracy on the dual-OOD split, outperforming prompting, retrieval-augmented and supervised fine-tuning baselines.
- Abstract(参考訳): 材料プロセスの最適化は、経路、条件、ツール、因果関係の推論を必要とするが、ほとんどの計算式は、合成手順をテキストまたは順序のステップに平らにする。
文献マイニングされたMatPROVグラフから構築された証明基底ベンチマークであるMatProcBenchを導入し,経路継続性,ステップレベル変数推論,大域因果一貫性にまたがる7つのプロセス推論タスクを評価する。
ProvMindは、類似のトレーニングプロセスを取得し、それらを証明可能なオプションレベルの互換性スコアに変換し、制約付き最終決定に言語モデルを使用するプロセスメモリ推論フレームワークである。
ProvMindはデュアルOODスプリットにおいて52.84\%の精度を実現し、プロンプト、検索拡張、教師付き微調整ベースラインを向上する。
関連論文リスト
- Controllable and Verifiable Process Data Synthesis for Process Reward Models [0.0]
プロセス報酬モデル(PRM)のためのプロセス監視データを合成するための制御可能で検証可能なフレームワークを提案する。
筆者らのフレームワークはまず,まず正しいシンボリック推論チェーンを構築し,テンプレート認識エラーを中間ステップに注入し,その後のステップを劣化状態下で再計算し,インジェクトされたステップがそのプレフィックスから導出できないことを確認する。
実験により、合成されたデータは、論理的推論ベンチマークと数理的推論への変換に基づいて、最高の8倍の精度を向上することが示された。
論文 参考訳(メタデータ) (2026-05-04T09:36:57Z) - Rectifying LLM Thought from Lens of Optimization [48.98086817378953]
ロングチェーン・オブ・シンクレット (Long chain-of- Thought, CoT) は、徹底的な調査と検討を可能にする。
進歩にもかかわらず、長いCoT LLMは、しばしば最適な推論行動を示す。
ポストトレーニング中のLCM推論を洗練するための新しい手法であるReProを紹介する。
論文 参考訳(メタデータ) (2025-12-01T17:41:08Z) - BRiTE: Bootstrapping Reinforced Thinking Process to Enhance Language Model Reasoning [78.63421517563056]
大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な機能を示した。
本稿では,新しいグラフィカルモデルを用いてLLM推論を定式化する統一確率的フレームワークを提案する。
本稿では,Bootstrapping Reinforced Thinking Process (BRiTE)アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2025-01-31T02:39:07Z) - Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge [78.28188747489769]
そこで我々は,Thinking-LLM-as-a-Judgeの優先最適化アルゴリズムであるEvalPlannerを提案する。
自己学習ループでは、EvalPlannerは、合成的に構築された評価計画と実行よりも反復的に最適化する。
提案手法はRewardBenchにおける生成報酬モデルのための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2025-01-30T02:21:59Z) - Coarse-to-Fine Process Reward Modeling for Mathematical Reasoning [20.686094849756937]
プロセス・リワード・モデル (Process Reward Model, PRM) は数学的推論において重要な役割を担い、高品質なプロセスデータを必要とする。
我々は,Large Language Models (LLM) が生成する推論ステップが,厳密なインクリメンタルな情報表示に失敗することが多く,冗長性が生じることを観察する。
本稿では,冗長なステップを検出するための簡易かつ効果的な粗大な戦略CFPRMを提案する。
論文 参考訳(メタデータ) (2025-01-23T12:44:45Z) - Step-KTO: Optimizing Mathematical Reasoning through Stepwise Binary Feedback [94.25162866972077]
Step-KTOは、プロセスレベルと結果レベルのバイナリフィードバックを組み合わせたトレーニングフレームワークである。
実験の結果,Step-KTOは最終回答の精度と中間推論の質の両方を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2025-01-18T15:38:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。