論文の概要: PKG-DPO: Optimizing Domain-Specific AI systems with Physics Knowledge Graphs and Direct Preference Optimization
- arxiv url: http://arxiv.org/abs/2508.18391v1
- Date: Mon, 25 Aug 2025 18:31:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.552342
- Title: PKG-DPO: Optimizing Domain-Specific AI systems with Physics Knowledge Graphs and Direct Preference Optimization
- Title(参考訳): PKG-DPO:物理知識グラフを用いたドメイン特化AIシステムの最適化と直接選好最適化
- Authors: Nitin Nagesh Kulkarni, Bryson Wilcox, Max Sawa, Jason Thom,
- Abstract要約: 物理知識グラフ(PKG)と直接選好最適化(DPO)を統合する新しいフレームワークであるPKG-DPOを紹介する。
PKG-DPO 17%は、KG-DPO (knowledge graph-based DPO)と比較して、制約違反が少なく、物理スコアが11%高い。
私たちの主な焦点は金属の接合ですが、このフレームワークは他のマルチスケールの物理駆動の領域にも広く適用できます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advancing AI systems in scientific domains like physics, materials science, and engineering calls for reasoning over complex, multi-physics phenomena while respecting governing principles. Although Large Language Models (LLMs) and existing preference optimization techniques perform well on standard benchmarks, they often struggle to differentiate between physically valid and invalid reasoning. This shortcoming becomes critical in high-stakes applications like metal joining, where seemingly plausible yet physically incorrect recommendations can lead to defects, material waste, equipment damage, and serious safety risks. To address this challenge, we introduce PKG-DPO, a novel framework that integrates Physics Knowledge Graphs (PKGs) with Direct Preference Optimization (DPO) to enforce physical validity in AI-generated outputs. PKG-DPO comprises three key components A) hierarchical physics knowledge graph that encodes cross-domain relationships, conservation laws, and thermodynamic principles. B) A physics reasoning engine that leverages structured knowledge to improve discrimination between physically consistent and inconsistent responses. C) A physics-grounded evaluation suite designed to assess compliance with domain-specific constraints. PKG-DPO achieves 17% fewer constraint violations and an 11% higher Physics Score compared to KG-DPO (knowledge graph-based DPO). Additionally, PKG-DPO demonstrates a 12\% higher relevant parameter accuracy and a 7% higher quality alignment in reasoning accuracy. While our primary focus is on metal joining, the framework is broadly applicable to other multi-scale, physics-driven domains, offering a principled approach to embedding scientific constraints into preference learning.
- Abstract(参考訳): 物理学、材料科学、工学といった科学分野におけるAIシステムの進歩は、統治原則を尊重しながら複雑な多物理現象を推論することを要求する。
大きな言語モデル(LLM)と既存の選好最適化技術は標準ベンチマークでよく機能するが、物理的に妥当な推論と無効な推論の区別に苦慮することが多い。
この欠点は、金属接合のような高度な用途において重要なものとなり、不適切な推奨事項は、欠陥、材料廃棄物、機器の損傷、深刻な安全リスクにつながる可能性がある。
この課題に対処するため,我々はPKG-DPOという物理知識グラフ(PKG)と直接選好最適化(DPO)を統合し,AI生成した出力の物理的妥当性を強制する新しいフレームワークを紹介した。
PKG-DPOは、ドメイン間の関係、保存法則、熱力学原理を符号化する3つの重要な構成要素A)階層物理学知識グラフから構成される。
B) 構造化知識を活用する物理推論エンジンは、物理的に整合性のある応答と整合性のない応答の識別を改善する。
C) 領域固有の制約の遵守を評価するために設計された物理基礎評価スイート。
PKG-DPOは、KG-DPO (knowledge graph-based DPO)と比較して17%少ない制約違反と11%高い物理スコアを達成する。
さらに、PKG-DPOは、関連パラメータの精度が12%高く、推論精度が7%高い品質アライメントを示す。
我々の主な焦点は金属の接合であるが、このフレームワークは他のマルチスケールの物理駆動の分野にも広く適用でき、科学的な制約を好みの学習に埋め込むための原則化されたアプローチを提供する。
関連論文リスト
- CMPhysBench: A Benchmark for Evaluating Large Language Models in Condensed Matter Physics [71.42168240638462]
CMPhysBenchは、凝縮物質物理学における大規模言語モデルの習熟度を評価するように設計されている。
以上の結果から,最高モデルであるGrok-4でさえ,CMPhysBench上での平均SEEDスコアが36点,精度が28%であった。
論文 参考訳(メタデータ) (2025-08-25T15:32:22Z) - Causal-Aware Intelligent QoE Optimization for VR Interaction with Adaptive Keyframe Extraction [6.2819120598047]
本稿では,VRゲームにおけるクオリティ・オブ・エクスペリエンス(QoE)を最大化するインテリジェントなフレームワークを提案する。
適応抽出と因果認識強化学習(RL)の統合
実験の結果、我々のフレームワークは対話的なレイテンシを著しく低減し、QoEを強化し、公平性を維持することがわかった。
論文 参考訳(メタデータ) (2025-06-24T07:32:34Z) - Flow Matching Meets PDEs: A Unified Framework for Physics-Constrained Generation [21.321570407292263]
本稿では,PDE残差と代数的関係の両方の物理制約をフローマッチングの対象に組み込む生成フレームワークである物理ベースフローマッチングを提案する。
提案手法では,FMよりも高精度な物理残差を最大8倍に抑えながら,分布精度では既存アルゴリズムよりも明らかに優れていることを示す。
論文 参考訳(メタデータ) (2025-06-10T09:13:37Z) - Paving the way for scientific foundation models: enhancing generalization and robustness in PDEs with constraint-aware pre-training [49.8035317670223]
科学基盤モデル(SciFM)は、様々な領域にまたがる伝達可能な表現を学習するための有望なツールとして登場しつつある。
本稿では,PDE残差を単独の学習信号として,あるいはデータ損失と組み合わせて事前学習に組み込むことにより,限定的あるいは実用的でないトレーニングデータに補償することを提案する。
以上の結果から, PDE制約による事前学習は, 解データのみを訓練したモデルよりも, 一般化を著しく向上させることが示された。
論文 参考訳(メタデータ) (2025-03-24T19:12:39Z) - Direct Preference Optimization for Primitive-Enabled Hierarchical Reinforcement Learning [75.9729413703531]
DIPPERは階層的な政策学習を二段階最適化問題として定式化する新しいHRLフレームワークである。
DIPPERは、スパース報酬シナリオにおいて、最先端のベースラインよりも最大40%改善されていることを示す。
論文 参考訳(メタデータ) (2024-11-01T04:58:40Z) - Secrets of RLHF in Large Language Models Part I: PPO [81.01936993929127]
大規模言語モデル (LLMs) は、人工知能の進歩のためのブループリントを定式化した。
人間のフィードバックによる強化学習(RLHF)がこの追求を支える重要な技術パラダイムとして出現する。
本稿では、RLHFの枠組みを解明し、PPOの内部構造を再評価し、PPOアルゴリズムを構成する部分が政策エージェントの訓練にどのように影響するかを考察する。
論文 参考訳(メタデータ) (2023-07-11T01:55:24Z) - Physics-aware deep learning framework for linear elasticity [0.0]
本稿では,線形連続弾性問題に対する効率的で堅牢なデータ駆動型ディープラーニング(DL)計算フレームワークを提案する。
フィールド変数の正確な表現のために,多目的損失関数を提案する。
弾性に対するAirimaty解やKirchhoff-Loveプレート問題を含むいくつかのベンチマーク問題を解く。
論文 参考訳(メタデータ) (2023-02-19T20:33:32Z) - PID-GAN: A GAN Framework based on a Physics-informed Discriminator for
Uncertainty Quantification with Physics [2.4309139330334846]
科学的応用においては、物理の知識を持つ深層学習モデルを学習して、物理的に一貫した一般化された解を生成することが重要である。
本稿では,PID-GANと呼ばれる新しい物理インフォーム型GANアーキテクチャを提案する。
提案するPID-GANフレームワークは,複数損失項からのジェネレータ勾配の不均衡に悩まされないことを示す。
論文 参考訳(メタデータ) (2021-06-06T00:12:57Z) - A hybrid MGA-MSGD ANN training approach for approximate solution of
linear elliptic PDEs [0.0]
MGA-MSGD(Modified Genetic-Multilevel Gradient Descent)トレーニングアルゴリズムを導入しました。
ANNによるPDEによって記述された3次元機械的問題の精度と効率を大幅に改善する。
論文 参考訳(メタデータ) (2020-12-18T10:59:07Z) - Benchmarking adaptive variational quantum eigensolvers [63.277656713454284]
VQEとADAPT-VQEの精度をベンチマークし、電子基底状態とポテンシャルエネルギー曲線を計算する。
どちらの手法もエネルギーと基底状態の優れた推定値を提供する。
勾配に基づく最適化はより経済的であり、勾配のない類似シミュレーションよりも優れた性能を提供する。
論文 参考訳(メタデータ) (2020-11-02T19:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。