論文の概要: Ontology-based knowledge graph infrastructure for interoperable atomistic simulation data
- arxiv url: http://arxiv.org/abs/2604.06230v1
- Date: Tue, 31 Mar 2026 20:01:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.088038
- Title: Ontology-based knowledge graph infrastructure for interoperable atomistic simulation data
- Title(参考訳): オントロジーに基づく相互運用可能な原子構造シミュレーションデータのための知識グラフ基盤
- Authors: Abril Azocar Guzman, Sarath Menon, Tilmann Hickel, Stefan Sandfeld,
- Abstract要約: 本稿では,原子シミュレーションデータを知識グラフとして表現し,統合するための基盤について述べる。
複数のソースからの異種データは、共通のドメイン整合表現に正規化される。
得られた知識グラフには、約8,000の計算サンプルを記述した750,000以上のトリプルが含まれている。
- 参考スコア(独自算出の注目度): 1.631115063641726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The reuse of atomistic simulation data is often limited by heterogeneous formats, incomplete metadata, and a lack of standardized representations of workflows and provenance. Here we present an ontology-based infrastructure for representing and integrating atomistic simulation data as a knowledge graph. The approach combines domain ontologies with a software framework that enables data capture both from existing datasets and directly from simulation workflows at the point of generation. Heterogeneous data from multiple sources are normalized into a common, ontology-aligned representation, enabling consistent querying and analysis across datasets. We demonstrate these capabilities through the integration of grain boundary data, cross-dataset analysis of material properties, and extraction of derived thermodynamic quantities from existing simulations. In addition, workflows are represented in a machine-readable form, enabling both forward provenance tracking and partial reconstruction of computational procedures. The resulting knowledge graph contains over 750,000 triples describing nearly 8,000 computational samples. This work provides a practical framework for improving the findability, interoperability, and reuse of atomistic simulation data.
- Abstract(参考訳): 原子論シミュレーションデータの再利用は、不均一なフォーマット、不完全なメタデータ、ワークフローと証明の標準化された表現の欠如によってしばしば制限される。
ここでは、原子論シミュレーションデータを知識グラフとして表現し、統合するためのオントロジーに基づくインフラについて述べる。
このアプローチは、ドメインオントロジーと、既存のデータセットと、生成時点でのシミュレーションワークフローの両方から直接のデータキャプチャを可能にするソフトウェアフレームワークを組み合わせる。
複数のソースからの異種データは、共通のオントロジー整合表現に正規化され、データセット間で一貫したクエリと分析を可能にする。
本研究では, 粒界データの統合, 材料特性のクロスデータセット解析, 既存シミュレーションからの熱力学量の抽出により, これらの機能を実証する。
さらに、ワークフローはマシン可読形式で表現され、前方のプロファイランス追跡と計算手順の部分的な再構築が可能である。
得られた知識グラフには、約8,000の計算サンプルを記述した750,000以上のトリプルが含まれている。
この研究は、原子論シミュレーションデータの発見可能性、相互運用性、再利用を改善するための実践的なフレームワークを提供する。
関連論文リスト
- Bridging the Simulation-to-Experiment Gap with Generative Models using Adversarial Distribution Alignment [51.246114581338865]
科学と工学における根本的な課題は、シミュレーションと実験のギャップである。
このギャップを埋めるデータ駆動型分散アライメントフレームワークを提案する。
本手法は,複数個の相関した観測可能値であっても,対象の観測可能分布を復元できることを実証する。
論文 参考訳(メタデータ) (2026-04-01T17:21:33Z) - Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis [3.3176565054468714]
本稿では、シミュレーションと現実のギャップを埋めることのできる、労働自由化のための新しい枠組みを提案する。
我々は、不対向画像画像変換にCycleGAN(Cycle-Consistent Generative Adversarial Network)を用いる。
この合成データに特化して訓練されたU-Netモデルは、目に見えない実験画像に展開する際、顕著な一般化を示した。
論文 参考訳(メタデータ) (2026-02-02T06:36:06Z) - From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence [91.54446789584826]
エピプレキシティ(英: Epiplexity)とは、計算的に境界付けられた観測者がデータから学べるものを捉える情報の形式化である。
計算によってどのように情報を生成するか、データの順序にどのように依存するか、そしてモデリングがデータ生成プロセス自体よりも複雑なプログラムを生成する可能性を示す。
論文 参考訳(メタデータ) (2026-01-06T18:04:03Z) - Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Detecting Model Misspecification in Cosmology with Scale-Dependent Normalizing Flows [0.3840425533789961]
本稿では,スケール依存型ニューラルサプリメント統計と正規化フローを組み合わせた新しいフレームワークを提案する。
本稿では,3つのCAMELSシミュレーションスイートの物質密度場とガス密度場を用いたアプローチへの最初の適用例を示す。
論文 参考訳(メタデータ) (2025-08-07T18:00:09Z) - Data-Driven Prediction of Dynamic Interactions Between Robot Appendage and Granular Material [2.551529992410986]
別のデータ駆動型モデリング手法が提案され、特定の長さスケールでの粒状地形とのロボットの動きの相互作用に関する洞察を得ることができた。
このアプローチは,高忠実度シミュレーションデータのオフライン収集とスパース実験データの集合から得られるオフラインデータに基づいて,オンラインで使用することができる。
結果は、オンラインとオフラインの両方のフェーズにおいて、未知の複雑な地形におけるロボットのナビゲーションと探索を支援することが期待されている。
論文 参考訳(メタデータ) (2025-06-12T16:43:21Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Modular machine learning-based elastoplasticity: generalization in the
context of limited data [0.0]
エラスト塑性の定式化のモジュラリティに頼って,データの変動量に対処できるハイブリッドフレームワークについて論じる。
発見された物質モデルは、よく補間できるだけでなく、トレーニングデータの領域外から熱力学的に一貫した方法で正確な外挿を可能にする。
論文 参考訳(メタデータ) (2022-10-15T17:35:23Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - A graph representation based on fluid diffusion model for multimodal
data analysis: theoretical aspects and enhanced community detection [14.601444144225875]
流体拡散に基づくグラフ定義の新しいモデルを提案する。
本手法は,マルチモーダルデータ解析において,コミュニティ検出のための最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-12-07T16:30:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。