論文の概要: Enhancing Data Integrity through Provenance Tracking in Semantic Web Frameworks
- arxiv url: http://arxiv.org/abs/2501.09029v1
- Date: Sun, 12 Jan 2025 16:13:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-17 16:36:31.919987
- Title: Enhancing Data Integrity through Provenance Tracking in Semantic Web Frameworks
- Title(参考訳): セマンティックWebフレームワークにおけるプロヴァンストラッキングによるデータの整合性向上
- Authors: Nilesh Jain,
- Abstract要約: SURROUND Australia Pty Ltdは、PROVデータモデル(PROV-DM)とそのセマンティックWeb変種であるPROV-Oの革新的な適用例を実証している。
論文では、包括的な実績データ、堅牢なバリデーション、トレーサビリティ、知識推論をキャプチャする同社のアーキテクチャを強調している。
- 参考スコア(独自算出の注目度): 1.3597551064547502
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This paper explores the integration of provenance tracking systems within the context of Semantic Web technologies to enhance data integrity in diverse operational environments. SURROUND Australia Pty Ltd demonstrates innovative applica-tions of the PROV Data Model (PROV-DM) and its Semantic Web variant, PROV-O, to systematically record and manage provenance information across multiple data processing domains. By employing RDF and Knowledge Graphs, SURROUND ad-dresses the critical challenges of shared entity identification and provenance granularity. The paper highlights the company's architecture for capturing comprehensive provenance data, en-abling robust validation, traceability, and knowledge inference. Through the examination of two projects, we illustrate how provenance mechanisms not only improve data reliability but also facilitate seamless integration across heterogeneous systems. Our findings underscore the importance of sophisticated provenance solutions in maintaining data integrity, serving as a reference for industry peers and academics engaged in provenance research and implementation.
- Abstract(参考訳): 本稿では,セマンティックWeb技術のコンテキスト内において,各種運用環境におけるデータの整合性を高めるためのプロビタンストラッキングシステムの統合について検討する。
SURROUND Australia Pty Ltdは、PROVデータモデル(PROV-DM)とそのセマンティックWeb変種であるPROV-Oの革新的な適用例を示し、複数のデータ処理領域にまたがる前兆情報を体系的に記録し管理する。
RDFとKnowledge Graphsを採用することで、SURROUNDは、共有エンティティの識別と証明の粒度に関する重要な課題に対処する。
論文では、包括的な実績データ、堅牢なバリデーション、トレーサビリティ、知識推論をキャプチャする同社のアーキテクチャを強調している。
2つのプロジェクトの検証を通じて,データ信頼性の向上だけでなく,異種システム間のシームレスな統合も実現していることを示す。
本研究は,データ整合性維持における高度な証明ソリューションの重要性を浮き彫りにするものである。
関連論文リスト
- Leveraging LLM Parametric Knowledge for Fact Checking without Retrieval [60.25608870901428]
信頼性は、大規模言語モデル(LLM)上に構築されたエージェントAIシステムの中核研究課題である
本研究では,任意の自然言語クレームの検証に焦点をあて,検索なしで事実チェックを行うタスクを提案する。
論文 参考訳(メタデータ) (2026-03-05T18:42:51Z) - Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。
SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。
本稿では,この新興領域を体系的に調査する。
論文 参考訳(メタデータ) (2026-01-15T18:55:03Z) - Intelligent Knowledge Mining Framework: Bridging AI Analysis and Trustworthy Preservation [0.4742825811314167]
本稿では,AI駆動分析と信頼性のある長期保存のギャップを埋めるための概念モデルであるIntelligent Knowledge Mining Framework(IKMF)を紹介する。
このフレームワークはデュアルストリームアーキテクチャを提案している。水平マイニングプロセスは、生データをセマンティックにリッチで機械操作可能な知識に変換し、それらの資産の整合性、証明性、計算を保証するために、並列のTrustworthy Archiving Streamを提供する。
論文 参考訳(メタデータ) (2025-12-19T17:01:03Z) - OpenDataArena: A Fair and Open Arena for Benchmarking Post-Training Dataset Value [74.80873109856563]
OpenDataArena(ODA)は、トレーニング後のデータの本質的な価値をベンチマークするために設計された、総合的でオープンなプラットフォームである。
ODAは4つの主要な柱からなる包括的なエコシステムを確立している。 (i) 多様なモデル間で公平でオープンな比較を保証する統一的なトレーニング評価パイプライン、 (ii) 異なる軸数に沿ってデータ品質をプロファイリングする多次元スコアリングフレームワーク、 (iii) データセットの系図を視覚化してコンポーネントソースを識別するインタラクティブなデータ系統探索である。
論文 参考訳(メタデータ) (2025-12-16T03:33:24Z) - Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms [1.7842332554022695]
本研究では,Entity Linking から派生した実効信号を統合した拡張 RAG アーキテクチャを提案する。
セマンティックとエンティティベースの情報を組み合わせるための3つの再ランク戦略を実装している。ハイブリッドスコア重み付けモデル、相互ランクの融合、クロスエンコーダのリランカである。
その結果、ドメイン固有の文脈において、相互階数融合に基づくハイブリッドスキーマは、ベースラインとクロスエンコーダのアプローチの両方で著しく優れていた。
論文 参考訳(メタデータ) (2025-12-05T18:59:18Z) - WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents [72.28593628378991]
WebResearcherは、マルコフ決定プロセスとしてディープリサーチを再構築する反復的なディープリサーチパラダイムである。
WebResearcherは最先端のパフォーマンスを実現し、フロンティアのプロプライエタリシステムを超えています。
論文 参考訳(メタデータ) (2025-09-16T17:57:17Z) - SynthGenNet: a self-supervised approach for test-time generalization using synthetic multi-source domain mixing of street view images [8.23277995673829]
テスト時間領域の堅牢な一般化を実現するための自己教師型学生-教員アーキテクチャであるSynthGenNetを紹介する。
私たちのコントリビューションには、さまざまな合成ソースからラベル付きデータをブレンドする新しいClassMix++アルゴリズムが含まれています。
実世界のデータセット上で50%の平均区間-Over-Union(mIoU)値を達成することにより、私たちのモデルは最先端(単一ソースで参照)よりも優れています。
論文 参考訳(メタデータ) (2025-09-02T13:08:03Z) - Enhancing Semantic Document Retrieval- Employing Group Steiner Tree Algorithm with Domain Knowledge Enrichment [0.0]
本研究は,多目的アルゴリズム「グループスタイナーツリーを用いた意味に基づく概念検索」の開発に焦点をあてる。
提案アルゴリズムはドメイン情報を組み込んでセマンティック・アウェア・ナレッジ表現とデータアクセスを強化する。
SemDRシステムの有効性を評価するために、170の現実世界の検索クエリからなるベンチマークを用いて性能評価を行う。
論文 参考訳(メタデータ) (2025-08-28T08:29:55Z) - Divide-Then-Align: Honest Alignment based on the Knowledge Boundary of RAG [51.120170062795566]
本稿では,問合せが知識境界外にある場合の"I don't know"で応答する機能を備えたRAGシステムを実現するためのDTAを提案する。
DTAは適切な棄権と精度のバランスをとり、検索強化システムの信頼性と信頼性を高める。
論文 参考訳(メタデータ) (2025-05-27T08:21:21Z) - So-Fake: Benchmarking and Explaining Social Media Image Forgery Detection [75.79507634008631]
So-Fake-Setは、200万以上の高品質な画像、多様な生成源、35の最先端生成モデルを用いて合成された画像を備えたソーシャルメディア指向のデータセットである。
本稿では,高精度な偽造検出,高精度な位置推定,解釈可能な視覚論理による説明可能な推論に強化学習を利用する高度な視覚言語フレームワークであるSo-Fake-R1を提案する。
論文 参考訳(メタデータ) (2025-05-24T11:53:35Z) - COSINT-Agent: A Knowledge-Driven Multimodal Agent for Chinese Open Source Intelligence [22.216759050092385]
オープンソースインテリジェンス(OSINT)は多様なマルチモーダルデータの統合と推論を必要とする。
中国におけるOSINTの課題に対処するための知識駆動型マルチモーダルエージェントであるCOSINT-Agentを紹介する。
COSINT-Agentの中心は、COSINT-MLLMとEES-KGを橋渡しする革新的なEES-Matchフレームワークである。
論文 参考訳(メタデータ) (2025-03-05T06:16:15Z) - World-Consistent Data Generation for Vision-and-Language Navigation [52.08816337783936]
VLN(Vision-and-Language Navigation)は、自然言語の指示に従って、エージェントがフォトリアリスティックな環境をナビゲートする必要がある課題である。
VLNの主な障害はデータの不足であり、目に見えない環境における一般化性能の低下につながる。
多様性と世界整合性の両方を満たす効率的なデータ拡張フレームワークである世界整合データ生成(WCGEN)を提案する。
論文 参考訳(メタデータ) (2024-12-09T11:40:54Z) - Deploying Large Language Models With Retrieval Augmented Generation [0.21485350418225244]
Retrieval Augmented Generationは、大規模言語モデルのトレーニングセット外のデータソースからの知識を統合するための重要なアプローチとして登場した。
本稿では,LLMとRAGを統合して情報検索を行うパイロットプロジェクトの開発とフィールドテストから得られた知見について述べる。
論文 参考訳(メタデータ) (2024-11-07T22:11:51Z) - Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [46.55831783809377]
大規模言語モデル (LLM) の幻覚を緩和するための効果的なアプローチとして, 検索拡張世代 (RAG) が認識されている。
本稿では,多様かつ相補的な領域にまたがる構造化知識と非構造化知識を組み合わせたベンチマークデータセットを標準化する。
また,マルチグラニュラリティプルーニング戦略を採用するのが主な特徴であるPruningRAGというプラグイン・アンド・プレイのRAGフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-03T03:31:37Z) - WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs [10.380692079063467]
本稿では,Web検索と知識グラフを統合したWeKnow-RAGを提案する。
まず,知識グラフの構造化表現と高次ベクトル検索の柔軟性を組み合わせることで,LLM応答の精度と信頼性を向上させる。
提案手法は,情報検索の効率と精度を効果的にバランスさせ,全体の検索プロセスを改善する。
論文 参考訳(メタデータ) (2024-08-14T15:19:16Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Self-consistent Deep Geometric Learning for Heterogeneous Multi-source Spatial Point Data Prediction [10.646376827353551]
環境モニタリングや天然資源管理といった分野において,マルチソース空間データ予測が重要である。
この領域の既存のモデルはドメイン固有の性質のためにしばしば不足し、様々な情報源からの情報を統合する戦略が欠如している。
我々は,地中真理ラベルを頼らずに,様々な情報源からの情報を順に整列する,革新的なマルチソース空間点データ予測フレームワークを導入する。
論文 参考訳(メタデータ) (2024-06-30T16:13:13Z) - Synthetic-To-Real Video Person Re-ID [57.937189569211505]
人物再識別(Re-ID)は重要な課題であり、公衆の安全と情報法医学に重要な応用がある。
本稿では、Re-IDの新規かつ挑戦的な設定、すなわちドメイン間ビデオベースの人物Re-IDについて検討する。
我々は、テストのためのトレーニングや実世界のビデオのソースドメインとして、合成ビデオデータセットを使用します。
論文 参考訳(メタデータ) (2024-02-03T10:19:21Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM for Cyber-Physical Production Systems [45.05372822216111]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Entity-Switched Datasets: An Approach to Auditing the In-Domain
Robustness of Named Entity Recognition Models [49.878051587667244]
そこで本稿では,エンティティの国家的起源によるパフォーマンスの違いに着目し,システムのドメイン内ロバスト性を評価する手法を提案する。
我々は、エンティティに切り替えたデータセットを作成し、元のテキストにある名前のエンティティを、同じタイプの、異なる国家起源の、もっともらしい名前のエンティティに置き換える。
同じ文脈では、ある起源のエンティティは、他の領域のエンティティよりも確実に認識される。
論文 参考訳(メタデータ) (2020-04-08T17:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。