論文の概要: The AnIML Ontology: Enabling Semantic Interoperability for Large-Scale Experimental Data in Interconnected Scientific Labs
- arxiv url: http://arxiv.org/abs/2604.01728v1
- Date: Thu, 02 Apr 2026 07:49:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.594309
- Title: The AnIML Ontology: Enabling Semantic Interoperability for Large-Scale Experimental Data in Interconnected Scientific Labs
- Title(参考訳): AnIMLオントロジー: 相互接続型科学研究所における大規模実験データのセマンティック相互運用の実現
- Authors: Wilf Morlidge, Elliott Watkiss-Leek, George Hannah, Harry Rostron, Andrew Ng, Ewan Johnson, Andrew Mitchell, Terry R. Payne, Valentina Tamma, Jacopo de Berardinis,
- Abstract要約: AnIMLは、分析化学と生物学のための柔軟なXMLベースの標準である。
我々は、AnIMLのセマンティクスを形式化し、Allotrope Data Formatと整列するOWL 2オントロジーであるAnIML Ontologyを提示する。
- 参考スコア(独自算出の注目度): 0.24823659985502475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Achieving semantic interoperability across heterogeneous experimental data systems remains a major barrier to data-driven scientific discovery. The Analytical Information Markup Language (AnIML), a flexible XML-based standard for analytical chemistry and biology, is increasingly used in industrial R&D labs for managing and exchanging experimental data. However, the expressivity of the XML schema permits divergent interpretations across stakeholders, introducing inconsistencies that undermine the interoperability the AnIML schema was designed to support. In this paper, we present the AnIML Ontology, an OWL 2 ontology that formalises the semantics of AnIML and aligns it with the Allotrope Data Format to support future cross-system and cross-lab interoperability. The ontology was developed using an expert-in-the-loop approach combining LLM-assisted requirement elicitation with collaborative ontology engineering. We validate the ontology through a multi-layered approach: data-driven transformation of real-world AnIML files into knowledge graphs, competency question verification via SPARQL, and a novel validation protocol based on adversarial negative competency questions mapped to established ontological anti-patterns and enforced via SHACL constraints.
- Abstract(参考訳): 不均一な実験データシステム間のセマンティック相互運用性を実現することは、データ駆動科学発見の大きな障壁である。
分析情報マークアップ言語(AnIML: Analytical Information Markup Language)は、分析化学と生物学のための柔軟なXMLベースの標準であり、実験データの管理と交換に産業R&Dラボでますます使われている。
しかし、XMLスキーマの表現力は、AnIMLスキーマがサポートするために設計された相互運用性を損なう不整合を導入し、ステークホルダー間で異なる解釈を可能にする。
本稿では, AnIML のセマンティクスを形式化した OWL 2 オントロジーである AnIML Ontology について述べる。
このオントロジーは、LPM支援要求誘発と協調オントロジー工学を組み合わせたループ・イン・ザ・ループ・アプローチを用いて開発された。
実世界のAnIMLファイルの知識グラフへのデータ駆動変換、SPARQLによる能力検証、および既存の存在論的アンチパターンにマッピングされ、SHACL制約によって強制される敵の負の能力質問に基づく新しい検証プロトコルにより、オントロジーを検証する。
関連論文リスト
- LLM/Agent-as-Data-Analyst: A Survey [54.08761322298559]
大規模言語モデル(LLM)とエージェント技術は、データ分析タスクの機能と開発パラダイムに根本的な変化をもたらした。
LLMは複雑なデータ理解、自然言語、意味分析機能、自律パイプラインオーケストレーションを可能にする。
論文 参考訳(メタデータ) (2025-09-28T17:31:38Z) - LLM Agents for Interactive Workflow Provenance: Reference Architecture and Evaluation Methodology [3.470217255779291]
本稿では,対話型大規模言語モデル(LLM)エージェントをランタイムデータ解析に活用する評価手法,参照アーキテクチャ,オープンソース実装を提案する。
提案手法では,自然言語を構造化された前処理クエリに変換する軽量なメタデータ駆動型設計を用いる。
LLaMA、GPT、Gemini、Claudeにまたがる評価では、多様なクエリクラスと現実世界の化学ワークフローを網羅し、モジュール設計、即時チューニング、Retrieval-Augmented Generation (RAG)が正確で洞察に富んだエージェント応答を可能にすることを示している。
論文 参考訳(メタデータ) (2025-09-17T13:51:29Z) - GenOM: Ontology Matching with Description Generation and Large Language Model [19.917106654694894]
本稿では,大規模言語モデル(LLM)に基づくオントロジーアライメントフレームワークであるGenOMを紹介する。
OAEI Bio-MLトラックで行った実験は、GenOMがしばしば競争力を発揮することを示した。
論文 参考訳(メタデータ) (2025-08-14T14:48:09Z) - Multimodal Behavioral Patterns Analysis with Eye-Tracking and LLM-Based Reasoning [12.054910727620154]
視線追跡データは、ユーザの認知状態に関する貴重な洞察を明らかにするが、その構造化された非言語的な性質のために分析することは困難である。
本稿では、視線追跡信号からの認知パターン抽出を促進するために、マルチモーダルな人間-AI協調フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-24T09:49:53Z) - Graft: Integrating the Domain Knowledge via Efficient Parameter Synergy for MLLMs [56.76586846269894]
MLLM(Multimodal Large Language Models)は、様々な領域で成功している。
その重要性にもかかわらず、ドメイン固有のMLLM間の知識共有の研究はほとんど未調査のままである。
専門家機能のモジュール構成を可能にする統一パラメータ統合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-30T15:07:41Z) - Define-ML: An Approach to Ideate Machine Learning-Enabled Systems [1.3541839896498067]
ソフトウェアシステムにおける機械学習(ML)は、特別なアイデアのアプローチを必要とする。
Lean Inceptionのような従来のアイデア手法では、MLの考慮事項に対する構造化されたサポートが欠如しています。
本稿では、リーンインセプションを適切なアクティビティで拡張するフレームワークであるDefin-MLを提案する。
論文 参考訳(メタデータ) (2025-06-25T17:11:26Z) - Don't Ignore Dual Logic Ability of LLMs while Privatizing: A
Data-Intensive Analysis in Medical Domain [19.46334739319516]
本研究では, LLMの二重論理能力が, 医療領域の民営化過程における影響について検討した。
以上の結果から,LLMに汎用ドメイン二重論理データを組み込むことによって,LLMの二重論理能力が向上するだけでなく,精度も向上することが示唆された。
論文 参考訳(メタデータ) (2023-09-08T08:20:46Z) - Interpretability from a new lens: Integrating Stratification and Domain
knowledge for Biomedical Applications [0.0]
本稿では, バイオメディカル問題データセットの k-fold cross-validation (CV) への階層化のための新しい計算手法を提案する。
このアプローチはモデルの安定性を改善し、信頼を確立し、トレーニングされたIMLモデルによって生成された結果の説明を提供する。
論文 参考訳(メタデータ) (2023-03-15T12:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。