論文の概要: Uncertainty in Automated Ontology Matching: Lessons Learned from an
Empirical Experimentation
- arxiv url: http://arxiv.org/abs/2310.11723v1
- Date: Wed, 18 Oct 2023 05:42:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-19 17:36:00.601407
- Title: Uncertainty in Automated Ontology Matching: Lessons Learned from an
Empirical Experimentation
- Title(参考訳): 自動オントロジーマッチングの不確実性:実証実験から学んだ教訓
- Authors: In\`es Osman, Salvatore F. Pileggi, Sadok Ben Yahia
- Abstract要約: オントロジは、相互運用によるデータセットのリンクとセマンティック統合において重要な役割を果たす。
本稿では、オントロジーマッチングに基づく手法を用いて、アプリケーションの観点からデータ統合にアプローチする。
- 参考スコア(独自算出の注目度): 6.491645162078057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data integration is considered a classic research field and a pressing need
within the information science community. Ontologies play a critical role in
such a process by providing well-consolidated support to link and semantically
integrate datasets via interoperability. This paper approaches data integration
from an application perspective, looking at techniques based on ontology
matching. An ontology-based process may only be considered adequate by assuming
manual matching of different sources of information. However, since the
approach becomes unrealistic once the system scales up, automation of the
matching process becomes a compelling need. Therefore, we have conducted
experiments on actual data with the support of existing tools for automatic
ontology matching from the scientific community. Even considering a relatively
simple case study (i.e., the spatio-temporal alignment of global indicators),
outcomes clearly show significant uncertainty resulting from errors and
inaccuracies along the automated matching process. More concretely, this paper
aims to test on real-world data a bottom-up knowledge-building approach,
discuss the lessons learned from the experimental results of the case study,
and draw conclusions about uncertainty and uncertainty management in an
automated ontology matching process. While the most common evaluation metrics
clearly demonstrate the unreliability of fully automated matching solutions,
properly designed semi-supervised approaches seem to be mature for a more
generalized application.
- Abstract(参考訳): データ統合は、古典的な研究分野であり、情報科学のコミュニティにおける必要に迫られている。
オントロジーは、相互運用性を通じてデータセットをリンクし、意味的に統合するための統合サポートを提供することで、そのようなプロセスにおいて重要な役割を果たす。
本稿では、オントロジーマッチングに基づく手法に着目し、アプリケーションの観点からデータ統合にアプローチする。
オントロジに基づくプロセスは、異なる情報ソースの手動マッチングを仮定することでのみ適切と考えることができる。
しかし、システムがスケールアップしたらアプローチが非現実的になるため、マッチングプロセスの自動化は魅力的なニーズとなる。
そこで,本研究では,既存の科学コミュニティによるオントロジー自動マッチングツールを用いた実データ実験を行った。
比較的単純なケーススタディ(つまり、グローバル指標の時空間的アライメント)を考えると、自動マッチングプロセスのエラーや不正確さに起因する重大な不確実性は明らかである。
具体的には,実世界のデータをボトムアップの知識構築アプローチとして検証し,ケーススタディの実験結果から得られた教訓を考察し,自動オントロジーマッチングプロセスにおける不確実性と不確実性管理に関する結論を引き出すことを目的とする。
最も一般的な評価指標は、完全に自動化されたマッチングソリューションの信頼性の欠如を示しているが、より一般化されたアプリケーションのために適切に設計された半教師付きアプローチは成熟しているようである。
関連論文リスト
- Bridging the Gap: Protocol Towards Fair and Consistent Affect Analysis [24.737468736951374]
日々の生活における機械学習アルゴリズムの統合の増加は、その展開における公平性と公平性の重要性を浮き彫りにしている。
既存のデータベースと方法論は均一性に欠けており、バイアスのある評価につながっている。
この研究は、6つの感情的なデータベースを分析し、属性を注釈付けし、データベース分割のための共通のプロトコルを提案することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-05-10T22:40:01Z) - Interactive Ontology Matching with Cost-Efficient Learning [2.006461411375746]
この研究は、マッチングに適したアクティブな学習方法であるDualLoopを紹介している。
既存のアクティブラーニング手法と比較すると,F1のスコアとリコールは一貫して向上した。
本稿では,建築,工学,建設(AEC)産業部門における運用実績について報告する。
論文 参考訳(メタデータ) (2024-04-11T11:53:14Z) - Self-consistent Validation for Machine Learning Electronic Structure [81.54661501506185]
機械学習と自己整合フィールド法を統合して,検証コストの低減と解釈可能性の両立を実現する。
これにより、積極的学習によるモデルの能力の探索が可能となり、実際の研究への統合への信頼がもたらされる。
論文 参考訳(メタデータ) (2024-02-15T18:41:35Z) - ValUES: A Framework for Systematic Validation of Uncertainty Estimation in Semantic Segmentation [2.1517210693540005]
不確実性推定は、セマンティックセグメンテーション法において不可欠で研究の難しい要素である。
データ関連とモデル関連の不確実性は実際に分離できるのか?
不確実性手法のどのコンポーネントが現実世界のパフォーマンスに欠かせないのか?
論文 参考訳(メタデータ) (2024-01-16T17:02:21Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Human-Centric Multimodal Machine Learning: Recent Advances and Testbed
on AI-based Recruitment [66.91538273487379]
人間中心のアプローチでAIアプリケーションを開発する必要性には、ある程度のコンセンサスがある。
i)ユーティリティと社会的善、(ii)プライバシとデータ所有、(iii)透明性と説明責任、(iv)AIによる意思決定プロセスの公正性。
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
論文 参考訳(メタデータ) (2023-02-13T16:44:44Z) - Easy Semantification of Bioassays [0.0]
本稿では, バイオアッセイを自動分離する手法を提案する。
我々のソリューションは、自動セマンティフィケーションの問題をラベル付けとクラスタリングという問題とは対照的である。
クラスタリングソリューションは、最先端のラベリングアプローチよりもはるかに優れています。
論文 参考訳(メタデータ) (2021-11-30T07:46:07Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。