Fugu-MT 論文翻訳(概要): PKG-DPO: Optimizing Domain-Specific AI systems with Physics Knowledge Graphs and Direct Preference Optimization

論文の概要: PKG-DPO: Optimizing Domain-Specific AI systems with Physics Knowledge Graphs and Direct Preference Optimization

arxiv url: http://arxiv.org/abs/2508.18391v1
Date: Mon, 25 Aug 2025 18:31:03 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-27 17:42:38.552342
Title: PKG-DPO: Optimizing Domain-Specific AI systems with Physics Knowledge Graphs and Direct Preference Optimization
Title（参考訳）: PKG-DPO:物理知識グラフを用いたドメイン特化AIシステムの最適化と直接選好最適化
Authors: Nitin Nagesh Kulkarni, Bryson Wilcox, Max Sawa, Jason Thom,
Abstract要約: 物理知識グラフ(PKG)と直接選好最適化(DPO)を統合する新しいフレームワークであるPKG-DPOを紹介する。 PKG-DPO 17%は、KG-DPO (knowledge graph-based DPO)と比較して、制約違反が少なく、物理スコアが11%高い。私たちの主な焦点は金属の接合ですが、このフレームワークは他のマルチスケールの物理駆動の領域にも広く適用できます。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Advancing AI systems in scientific domains like physics, materials science, and engineering calls for reasoning over complex, multi-physics phenomena while respecting governing principles. Although Large Language Models (LLMs) and existing preference optimization techniques perform well on standard benchmarks, they often struggle to differentiate between physically valid and invalid reasoning. This shortcoming becomes critical in high-stakes applications like metal joining, where seemingly plausible yet physically incorrect recommendations can lead to defects, material waste, equipment damage, and serious safety risks. To address this challenge, we introduce PKG-DPO, a novel framework that integrates Physics Knowledge Graphs (PKGs) with Direct Preference Optimization (DPO) to enforce physical validity in AI-generated outputs. PKG-DPO comprises three key components A) hierarchical physics knowledge graph that encodes cross-domain relationships, conservation laws, and thermodynamic principles. B) A physics reasoning engine that leverages structured knowledge to improve discrimination between physically consistent and inconsistent responses. C) A physics-grounded evaluation suite designed to assess compliance with domain-specific constraints. PKG-DPO achieves 17% fewer constraint violations and an 11% higher Physics Score compared to KG-DPO (knowledge graph-based DPO). Additionally, PKG-DPO demonstrates a 12\% higher relevant parameter accuracy and a 7% higher quality alignment in reasoning accuracy. While our primary focus is on metal joining, the framework is broadly applicable to other multi-scale, physics-driven domains, offering a principled approach to embedding scientific constraints into preference learning.
Abstract（参考訳）: 物理学、材料科学、工学といった科学分野におけるAIシステムの進歩は、統治原則を尊重しながら複雑な多物理現象を推論することを要求する。大きな言語モデル(LLM)と既存の選好最適化技術は標準ベンチマークでよく機能するが、物理的に妥当な推論と無効な推論の区別に苦慮することが多い。この欠点は、金属接合のような高度な用途において重要なものとなり、不適切な推奨事項は、欠陥、材料廃棄物、機器の損傷、深刻な安全リスクにつながる可能性がある。この課題に対処するため,我々はPKG-DPOという物理知識グラフ(PKG)と直接選好最適化(DPO)を統合し,AI生成した出力の物理的妥当性を強制する新しいフレームワークを紹介した。 PKG-DPOは、ドメイン間の関係、保存法則、熱力学原理を符号化する3つの重要な構成要素A)階層物理学知識グラフから構成される。 B) 構造化知識を活用する物理推論エンジンは、物理的に整合性のある応答と整合性のない応答の識別を改善する。 C) 領域固有の制約の遵守を評価するために設計された物理基礎評価スイート。 PKG-DPOは、KG-DPO (knowledge graph-based DPO)と比較して17%少ない制約違反と11%高い物理スコアを達成する。さらに、PKG-DPOは、関連パラメータの精度が12%高く、推論精度が7%高い品質アライメントを示す。我々の主な焦点は金属の接合であるが、このフレームワークは他のマルチスケールの物理駆動の分野にも広く適用でき、科学的な制約を好みの学習に埋め込むための原則化されたアプローチを提供する。

関連論文リスト

Learning Data-Efficient and Generalizable Neural Operators via Fundamental Physics Knowledge [8.269904705399474]
機械学習の最近の進歩により、ニューラルネットワークオペレータは物理的なシステムの進化をモデル化するための強力なサロゲートとして機能するようになった。本稿では,元のPDEと簡易な基本形式の両方から共同で学習する多物理学習フレームワークを提案する。我々のフレームワークはデータの効率を高め、予測誤差を減らし、アウト・オブ・ディストリビューション(OOD)の一般化を改善する。
論文参考訳（メタデータ） (2026-02-16T20:45:10Z)
SciIF: Benchmarking Scientific Instruction Following Towards Rigorous Scientific Intelligence [60.202862987441684]
科学的妥当性を確立する制約に厳格に固執しながら、問題を解決する能力。具体的には,大学レベルの問題と制約の固定されたカタログをペアにすることで,この能力を評価するマルチディシプリンのベンチマークであるSciIFを紹介する。 SciIFは、解の正当性と多拘束性の両方を測定することにより、構成的推論失敗のきめ細かい診断を可能にする。
論文参考訳（メタデータ） (2026-01-08T09:45:58Z)
PI-MFM: Physics-informed multimodal foundation model for solving partial differential equations [6.876642270107136]
本稿では, 事前学習と適応において, 制御方程式を直接強制する物理インフォームド・マルチモーダル基礎モデル(PI-MFM)を提案する。 PI-MFMは入力としてPDEのシンボル表現を取り、入力表現からPDEの残留損失を自動的に組み立てる。 13のパラメトリックな1次元時間依存PDEファミリのベンチマークでは、PI-MFMは純粋にデータ駆動のファミリを上回っている。
論文参考訳（メタデータ） (2025-12-28T19:43:57Z)
Hard-Constrained Neural Networks with Physics-Embedded Architecture for Residual Dynamics Learning and Invariant Enforcement in Cyber-Physical Systems [0.5735035463793009]
我々は、リカレントインテグレータ内に既知の物理をハード構造制約として埋め込んだ汎用アーキテクチャであるHybrid Recurrent Physics-Informed Neural Network (HRPINN) を定式化し、残留力学のみを学習する。第2に,計画HRPINN (PHRPINN, Projected HRPINN) を導入する。実世界のバッテリ確率DAEでHRPINNを評価し,標準制約ベンチマークでPHRPINNを評価する。
論文参考訳（メタデータ） (2025-11-28T16:06:24Z)
PRISM-Physics: Causal DAG-Based Process Evaluation for Physics Reasoning [57.868248683256574]
PRISM-Physicsはプロセスレベルの評価フレームワークであり、複雑な物理推論問題のベンチマークである。解は公式の有向非巡回グラフ(DAG)として表される。その結果,評価フレームワークは人的専門家のスコアと一致していることがわかった。
論文参考訳（メタデータ） (2025-10-03T17:09:03Z)
CMPhysBench: A Benchmark for Evaluating Large Language Models in Condensed Matter Physics [71.42168240638462]
CMPhysBenchは、凝縮物質物理学における大規模言語モデルの習熟度を評価するように設計されている。以上の結果から,最高モデルであるGrok-4でさえ,CMPhysBench上での平均SEEDスコアが36点,精度が28%であった。
論文参考訳（メタデータ） (2025-08-25T15:32:22Z)
Causal-Aware Intelligent QoE Optimization for VR Interaction with Adaptive Keyframe Extraction [6.2819120598047]
本稿では,VRゲームにおけるクオリティ・オブ・エクスペリエンス(QoE)を最大化するインテリジェントなフレームワークを提案する。適応抽出と因果認識強化学習(RL)の統合実験の結果、我々のフレームワークは対話的なレイテンシを著しく低減し、QoEを強化し、公平性を維持することがわかった。
論文参考訳（メタデータ） (2025-06-24T07:32:34Z)
Flow Matching Meets PDEs: A Unified Framework for Physics-Constrained Generation [21.321570407292263]
本稿では,PDE残差と代数的関係の両方の物理制約をフローマッチングの対象に組み込む生成フレームワークである物理ベースフローマッチングを提案する。提案手法では,FMよりも高精度な物理残差を最大8倍に抑えながら,分布精度では既存アルゴリズムよりも明らかに優れていることを示す。
論文参考訳（メタデータ） (2025-06-10T09:13:37Z)
Paving the way for scientific foundation models: enhancing generalization and robustness in PDEs with constraint-aware pre-training [49.8035317670223]
科学基盤モデル(SciFM)は、様々な領域にまたがる伝達可能な表現を学習するための有望なツールとして登場しつつある。本稿では,PDE残差を単独の学習信号として,あるいはデータ損失と組み合わせて事前学習に組み込むことにより,限定的あるいは実用的でないトレーニングデータに補償することを提案する。以上の結果から, PDE制約による事前学習は, 解データのみを訓練したモデルよりも, 一般化を著しく向上させることが示された。
論文参考訳（メタデータ） (2025-03-24T19:12:39Z)
Advancing Generalization in PINNs through Latent-Space Representations [71.86401914779019]
物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)によって支配される力学系のモデリングにおいて大きな進歩を遂げた。本稿では,多種多様なPDE構成を効果的に一般化する物理インフォームドニューラルPDE解法PIDOを提案する。 PIDOは1次元合成方程式と2次元ナビエ・ストークス方程式を含む様々なベンチマークで検証する。
論文参考訳（メタデータ） (2024-11-28T13:16:20Z)
Direct Preference Optimization for Primitive-Enabled Hierarchical Reinforcement Learning [75.9729413703531]
DIPPERは階層的な政策学習を二段階最適化問題として定式化する新しいHRLフレームワークである。 DIPPERは、スパース報酬シナリオにおいて、最先端のベースラインよりも最大40%改善されていることを示す。
論文参考訳（メタデータ） (2024-11-01T04:58:40Z)
Secrets of RLHF in Large Language Models Part I: PPO [81.01936993929127]
大規模言語モデル (LLMs) は、人工知能の進歩のためのブループリントを定式化した。人間のフィードバックによる強化学習(RLHF)がこの追求を支える重要な技術パラダイムとして出現する。本稿では、RLHFの枠組みを解明し、PPOの内部構造を再評価し、PPOアルゴリズムを構成する部分が政策エージェントの訓練にどのように影響するかを考察する。
論文参考訳（メタデータ） (2023-07-11T01:55:24Z)
Physics-aware deep learning framework for linear elasticity [0.0]
本稿では,線形連続弾性問題に対する効率的で堅牢なデータ駆動型ディープラーニング(DL)計算フレームワークを提案する。フィールド変数の正確な表現のために,多目的損失関数を提案する。弾性に対するAirimaty解やKirchhoff-Loveプレート問題を含むいくつかのベンチマーク問題を解く。
論文参考訳（メタデータ） (2023-02-19T20:33:32Z)
PID-GAN: A GAN Framework based on a Physics-informed Discriminator for Uncertainty Quantification with Physics [2.4309139330334846]
科学的応用においては、物理の知識を持つ深層学習モデルを学習して、物理的に一貫した一般化された解を生成することが重要である。本稿では,PID-GANと呼ばれる新しい物理インフォーム型GANアーキテクチャを提案する。提案するPID-GANフレームワークは,複数損失項からのジェネレータ勾配の不均衡に悩まされないことを示す。
論文参考訳（メタデータ） (2021-06-06T00:12:57Z)
A hybrid MGA-MSGD ANN training approach for approximate solution of linear elliptic PDEs [0.0]
MGA-MSGD(Modified Genetic-Multilevel Gradient Descent)トレーニングアルゴリズムを導入しました。 ANNによるPDEによって記述された3次元機械的問題の精度と効率を大幅に改善する。
論文参考訳（メタデータ） (2020-12-18T10:59:07Z)
Benchmarking adaptive variational quantum eigensolvers [63.277656713454284]
VQEとADAPT-VQEの精度をベンチマークし、電子基底状態とポテンシャルエネルギー曲線を計算する。どちらの手法もエネルギーと基底状態の優れた推定値を提供する。勾配に基づく最適化はより経済的であり、勾配のない類似シミュレーションよりも優れた性能を提供する。
論文参考訳（メタデータ） (2020-11-02T19:52:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。