論文の概要: Full-Stack Domain Enhancement for Combustion LLMs: Construction and Optimization
- arxiv url: http://arxiv.org/abs/2603.19268v1
- Date: Fri, 27 Feb 2026 08:27:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.810443
- Title: Full-Stack Domain Enhancement for Combustion LLMs: Construction and Optimization
- Title(参考訳): 燃焼用LLMのフルスタックドメイン拡張:構築と最適化
- Authors: Quanjia Xiao, Weimin Ouyang, Zonglin Yang, Tianhao Wu, Qingguo Zhou, Runze Mao, Zhi X. Chen,
- Abstract要約: 汎用大規模言語モデル(LLM)は、ドメイン知識の不足と物理保護法に準拠できないため、深刻な幻覚を引き起こすことが多い。
燃焼科学の分野に適したフルスタックドメイン拡張LLMワークフローを提案する。
また、燃焼科学における複雑な推論タスクに特化して設計された、標準化された評価ベンチマークであるFlameBenchをリリースする。
- 参考スコア(独自算出の注目度): 9.118491408766753
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) in the direction of task adaptation and capability enhancement for professional fields demonstrate significant application potential. Nevertheless, for complex physical systems such as combustion science, general-purpose LLMs often generate severe hallucinations due to insufficient domain knowledge and the inability to adhere to physical conservation laws. To address this issue, we propose the first full-stack domain-enhanced LLM workflow tailored for the field of combustion science, which integrates automated domain corpus construction, incremental pre-training, instruction fine-tuning, and verifiable reward-based reinforcement learning. This workflow ensures that the model truly internalizes physical laws rather than merely learning textual statistical patterns. We also release FlameBench, a standardized evaluation benchmark specifically designed for complex reasoning tasks in combustion science. Experimental results demonstrate that the model developed in this work significantly outperforms state-of-the-art general-purpose closed-source models and traditional retrieval-augmented generation methods on combustion science reasoning tasks. This work lays a solid technical and resource foundation for the subsequent development of domain-specific scientific research agents with reliable scientific reasoning capabilities.
- Abstract(参考訳): 大規模言語モデル(LLM)は,専門分野におけるタスク適応と能力向上の方向性を示す。
それでも、燃焼科学のような複雑な物理系では、一般用途のLLMは、ドメイン知識の不足と物理保存法に準拠できないため、深刻な幻覚を生じることが多い。
そこで本研究では, 自動ドメインコーパス構築, インクリメンタル事前学習, 命令微調整, 検証可能な報酬に基づく強化学習を統合した, 燃焼科学の分野に適した, フルスタックドメイン拡張LLMワークフローを提案する。
このワークフローにより、モデルは単にテキスト統計パターンを学習するのではなく、物理的な法則を真に内部化する。
また、燃焼科学における複雑な推論タスクに特化して設計された、標準化された評価ベンチマークであるFlameBenchをリリースする。
実験結果から,本研究で開発されたモデルは,燃焼科学推論タスクにおける最先端の汎用クローズドソースモデルと従来の検索強化生成手法を著しく上回ることがわかった。
この研究は、信頼できる科学的推論能力を持つドメイン固有の科学研究エージェントの開発のための、しっかりとした技術と資源の基礎を築いた。
関連論文リスト
- Grounding LLMs in Scientific Discovery via Embodied Actions [84.11877211907647]
大規模言語モデル (LLMs) は科学的発見に大きな可能性を示しているが、理論的推論と物理シミュレーションのギャップを埋めるのに苦労している。
EmbodiedActは、確立された科学ソフトウェアを、密着した知覚・実行ループによる実施行動の基盤化により、アクティブな実施エージェントに変換するフレームワークである。
論文 参考訳(メタデータ) (2026-02-24T07:37:18Z) - Towards LLM-enabled autonomous combustion research: A literature-aware agent for self-corrective modeling workflows [9.40063486755374]
FlamePilotは、自動および自己補正CFDによる燃焼モデリング研究を促進するように設計されている。
システムは、科学的な記事から学び、初期設定から最適化された結果までシミュレーションを導くための重要な情報を抽出することができる。
ケーススタディでは、FlamePilotが研究論文を自動で構成されたシミュレーションに変換し、シミュレーションを実行し、結果を後処理し、エビデンスに基づく改善を提案し、収束のために多段階のパラメータスタディを管理した。
論文 参考訳(メタデータ) (2026-01-04T04:00:28Z) - An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - General-Reasoner: Advancing LLM Reasoning Across All Domains [64.70599911897595]
強化学習(RL)は近年,大規模言語モデル(LLM)の推論能力の向上に強い可能性を示している。
本稿では,多分野にわたるLSM推論能力の向上を目的とした,新たなトレーニングパラダイムであるGeneral-Reasonerを提案する。
私たちは一連のモデルをトレーニングし、物理学、化学、金融、電子工学など幅広い分野をカバーする幅広いデータセットでそれらを評価します。
論文 参考訳(メタデータ) (2025-05-20T17:41:33Z) - Evaluating Large Language Models for Real-World Engineering Tasks [75.97299249823972]
本稿では,実運用指向のエンジニアリングシナリオから得られた100以上の質問をキュレートしたデータベースを提案する。
このデータセットを用いて、4つの最先端の大規模言語モデル(LLM)を評価する。
以上の結果から,LLMは時間的および構造的推論において強みを示すが,抽象的推論や形式的モデリング,文脈に敏感な工学的論理にはかなり苦労することがわかった。
論文 参考訳(メタデータ) (2025-05-12T14:05:23Z) - OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery [12.306721865990053]
一般科学のための専門的な大規模推論モデルであるOmniScienceを紹介する。
我々は、分子を潜在的電解質溶媒または添加剤として効率よくランク付けする電池剤を開発した。
我々は,ドメイン適応型事前学習と推論に基づく知識蒸留が性能レベルを達成するために重要であることをアブレーション実験で実証した。
論文 参考訳(メタデータ) (2025-03-22T01:18:59Z) - Exploring the Benefits of Domain-Pretraining of Generative Large Language Models for Chemistry [5.4665365335928024]
我々は、科学分野におけるオフ・ザ・シェルフとより標的となる基礎モデルを活用することのトレードオフについて検討する。
本研究は, ある科学領域, 化学領域に対するドメイン内事前学習の利点を考察し, ゼロショットおよび少数ショットプロンプトを用いたオープンソースオフザシェルフモデルと比較する。
その結果、ドメイン内ベースモデルではゼロショット設定でドメイン内タスクを合理的に実行することができるだけでなく、命令の微調整によるさらなる適応は、化学固有のタスクに顕著なパフォーマンスをもたらすことがわかった。
論文 参考訳(メタデータ) (2024-11-05T22:45:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。