論文の概要: A Pythonic Functional Approach for Semantic Data Harmonisation in the ILIAD Project
- arxiv url: http://arxiv.org/abs/2604.13042v1
- Date: Fri, 27 Feb 2026 16:49:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.629648
- Title: A Pythonic Functional Approach for Semantic Data Harmonisation in the ILIAD Project
- Title(参考訳): ILIADプロジェクトにおける意味的データ調和のためのPython関数アプローチ
- Authors: Erik Johan Nystad, Francisco Martín-Recuerda,
- Abstract要約: 我々は,ユーザが単純な関数呼び出しによって正しいRDFを生成できるような,意味データ調和のためのPython的アプローチを開発した。
関数はPythonライブラリとして構成され、Ocean Information Model (OIM)の設計パターンをエンコードし、複数の抽象化レベルにまたがって編成される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Semantic data harmonisation is a central requirement in the ILIAD project, where heterogeneous environmental data must be harmonised according to the Ocean Information Model (OIM), a modular family of ontologies for enabling the implementation of interoperable Digital Twins of the Ocean. Existing approaches to Semantic Data Harmonisation, such as RML and OTTR, offer valuable abstractions but require extensive knowledge of the technical intricacies of the OIM and the Semantic Web standards, including namespaces, IRIs, OWL constructors, and ontology design patterns. Furthermore, RML and OTTR oblige practitioners to learn specialised syntaxes and dedicated tooling. Data scientists in ILIAD have found these approaches overly cumbersome and have therefore expressed the need for a solution that abstracts away these technical details while remaining seamlessly integrated into their Python-based environments. To address these requirements, we have developed a Pythonic functional approach to semantic data harmonisation that enables users to produce correct RDF through simple function calls. The functions, structured as Python libraries, encode the design patterns of the OIM and are organised across multiple levels of abstraction. Low-level functions directly expose OWL and RDF syntax, mid-level functions encapsulate ontology design patterns, and high-level domain-specific functions orchestrate data harmonisation tasks by invoking mid-level functions. According to feedback from ILIAD data scientists, this approach satisfies their requirements and substantially enhances their ability to participate in harmonisation activities. In this paper, we present the details of our Pythonic functional approach to semantic data harmonisation and demonstrate its applicability within the ILIAD Aquaculture pilot.
- Abstract(参考訳): セマンティックデータハーモニゼーション(Semantic data harmonization)は、異種環境データを相互運用可能なDigital Twins of the Oceanの実装を可能にするオントロジーのモジュールファミリーであるOcean Information Model (OIM) に従って調和させるILIADプロジェクトにおいて、中心的な要件である。
RMLやOTTRのような既存のセマンティックデータ調和へのアプローチは、価値ある抽象化を提供するが、名前空間、IRI、OWLコンストラクタ、オントロジーデザインパターンを含む、OIMとセマンティックウェブ標準の技術的な複雑さに関する広範な知識を必要とする。
さらに、RMLとOTTRは実践者に専門の構文や専用のツールを学ぶことを義務付けている。
ILIADのデータサイエンティストは、これらのアプローチがあまりに煩雑であることを発見し、Pythonベースの環境にシームレスに統合されたまま、これらの技術的な詳細を抽象化するソリューションの必要性を表明した。
これらの要件に対処するために,ユーザが単純な関数呼び出しによって正しいRDFを生成可能な,意味データ調和のためのPython関数アプローチを開発した。
関数はPythonライブラリとして構成され、OIMの設計パターンをエンコードし、複数の抽象化レベルにまたがって編成される。
低レベルの関数はOWLとRDFの構文を直接公開し、中レベルの関数はオントロジー設計パターンをカプセル化し、高レベルの関数は中レベルの関数を呼び出し、データ調和タスクを編成する。
ILIADデータサイエンティストのフィードバックによると、このアプローチは彼らの要求を満たし、調和活動に参加する能力を大幅に向上させる。
本稿では,Python のセマンティックデータ調和に関する機能的アプローチの詳細を述べるとともに,ILIAD アクアカルチャーパイロットにおける適用性を示す。
関連論文リスト
- Code-in-the-Loop Forensics: Agentic Tool Use for Image Forgery Detection [59.04089915447622]
ForenAgentはインタラクティブなIFDフレームワークで、MLLMが検出対象に関するPythonベースの低レベルツールを自律的に生成、実行、洗練することができる。
人間の推論にインスパイアされた我々は、グローバルな認識、局所的な焦点、反復的探索、そして全体論的偏見を含む動的推論ループを設計する。
実験の結果,ForenAgent は IFD 課題に対する創発的なツール利用能力と反射的推論を示すことがわかった。
論文 参考訳(メタデータ) (2025-12-18T08:38:44Z) - SyGra: A Unified Graph-Based Framework for Scalable Generation, Quality Tagging, and Management of Synthetic Data [0.0]
大規模言語モデル(LLM)のための総合的な合成データ生成フレームワークを提案する。
本手法では,手作業による介入を最小限に抑えた複雑な対話フローをモデル化可能なモジュール型および構成型パイプラインを用いる。
得られたデータセットは、SFTとDPOの両方のユースケースをサポートするフレキシブルなスキーマの下で構成され、多様なトレーニングへのシームレスな統合を可能にする。
論文 参考訳(メタデータ) (2025-08-21T10:35:41Z) - RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs [3.41612427812159]
デジタルコンテンツ作成ツールでは、ユーザは、API呼び出しにマップしなければならない自然言語クエリを通じて、ニーズを表現します。
既存の合成データ生成アプローチでは、実世界のデータ分散を複製することができない。
高品質な合成学習データを生成するルータベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-05-15T16:53:45Z) - Interactive Data Harmonization with LLM Agents: Opportunities and Challenges [8.173658353548147]
本稿では,LLMに基づく推論,対話型ユーザインタフェース,データ調和プリミティブのライブラリを組み合わせたシステムであるHarmoniaを紹介する。
これは、データセットを標準フォーマットにマッピングする再利用可能なパイプラインをインタラクティブに作成するのに役立つ。
論文 参考訳(メタデータ) (2025-02-10T23:50:09Z) - Towards Human-Guided, Data-Centric LLM Co-Pilots [53.35493881390917]
CliMB-DCは、機械学習コパイロットのための、ヒューマンガイド付き、データ中心のフレームワークである。
高度なデータ中心ツールとLLM駆動推論を組み合わせることで、堅牢でコンテキスト対応のデータ処理を可能にする。
CliMB-DCが未処理のデータセットをML対応フォーマットに変換する方法を示す。
論文 参考訳(メタデータ) (2025-01-17T17:51:22Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。
我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2024-09-02T03:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。